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EDITORIAL NOTE 


In Estadística No. 55 (Vol. XV, June 
1957), a special issue on sampling, the 
publication of additional articles on the 
same subject was anticipated so as to cover 
the work of other eminent writers and 
researchers who had made or are making 
definite contributions to the development 
of sampling theory and application, but 
did not appear as authors in that special 
issue. Accordingly, Estadística No. 59-60 
(Vol. XVI, June 1958) included two ad- 
ditional articles on sampling: A Spanish 
version of an article by Morris H. Hansen 
and William N. Hurwitz titled “On the 
Theory of Sampling from Finite Popula- 
tions,”” originally published in the Decem- 
ber 1943 issue of The Annals of Mathemat- 
ical Statistics; and a Spanish version of a 
paper titled “On the Presentation of the 
Results of Sample Surveys as Legal Evi- 
dence,'”” presented by W. Edwards Deming 
at the 1952 meeting, in Chicago, of the 
American Statistical 
published in the Journal of the 
society (Journal of the American Statistical 
Association, Vol. 49, December 1954). 


Publication of 


Association and later 


same 


Hansen 
after its 
pearence was justified both for its historical 


and Hurwitz's 


article 15 years original ap- 


significance and its valuable content which 


embodies basic principles still of wide 


usage, and selection of Deming's paper 


was considered  opportune because it 


provides a most vivid illustration of a 
new specific function of the statistician in 
the field of sample surveys. 

Materializing further the anticipation 
advanced in Estadística No. 55, the present 
issue Of this Journal includes, as its key 
article, the 


historical 


Spanish version of another 
text which laid down basic 


principles which have proved 10 be most 


effective in giving sampling application 
wider possibilities under normal financial- 


This text is 
Jerzy Neyman's paper “On the Two Dif- 
ferent Aspects of the Representative 
Method: The Method of Stratified Sampl- 
ing and the Method of Purposive Selec- 
tion,'* read and discussed at a session of 
the Royal Statistical Society in 1934. 


administrative conditions. 


NOTA EDITORIAL 


En Estadística No. 55 (Vol. XV, Junio 
1957), número especial sobre muestreo, se 
previó la publicación de artículos adicio- 
nales sobre el mismo tema, en forma de 
abarcar a otros eminentes escritores e in- 
vestigadores que han aportado, o se en- 
cuentran aportando, contribuciones positi- 
vas al desarrollo de la teoría y a la aplica- 
ción del muestreo, pero que no aparecían 
como autores en aquél número especial. 
Conforme a ello, Estadística No. 59-60 
(Vol. XVI, Junio 1958) incluyó dos traba- 
jos adicionales sobre muestreo: La versión 
española del artículo de Morris H. Hansen 
y William N. Hurwitz bajo el título “Sobre 
la Teoría de Muestreo de Poblaciones Fi- 
nitas””, publicado inicialmente en el nú- 
mero de diciembre de 1943 de The Annals 
of Mathematical Statistics; y la versión es- 
pañola del estudio titulado “Sobre la Pre- 
sentación como Evidencia Legal de los Re- 
sultados de Encuestas por Muestras”, pre- 
sentado por W. Edwards Deming a la 
reunión efectuada en Chicago en 1952 por 
la American Statistical Association y publi- 
cado posteriormente en la revista de dicha 
sociedad (Journal of the American Sta 
tistical Association, Vol. 49, diciembre de 
1954). 

La publicación del artículo de Hansen 
y Hurwitz, 15 años después de su aparición 
original, fue justificada no sólo por su 
significación histórica sino también por el 
valor de su contenido que encierra prin- 
cipios básicos de amplia utilización aún 
actualmente; la selección del estudio de 
Deming fue considerada oportuna por 
cuanto proporciona una ilustración vivísi- 
ma de una nueva función específica del 
estadístico en el campo de las encuestas por 
muestreo. 
más la realización de 
lo previsto en Estadística No. 55, el pre- 
sente número de la Revista incluye, como 
su artículo central, la versión española de 
otro texto histórico que estableció princi- 
pios que han revelado su máxima efectivi- 
dad en la mayor expansión de la aplicación 
del muestreo bajo condiciones financiero- 
-administrativas normales. Trátase del es- 
tudio de Jerzy Neyman “Sobre los Dos 
Aspectos Diferentes del Método Represen- 
tativo: El Método de Muestreo Estratifica- 
do y el Método de Selección Dirigida” leído 
y discutido en una sesión de la Royal 
Statistical Society en 1934. 


Ampliando aún 
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The discussion which followed the 
presentation of Neyman's paper in its 
Spanish version is also included in this 
issue. The tone of some criticisms made 
during the discussion is a clear demonstra- 
tion of the impact which, at that time, 
the ideas submitted by Neyman's had on 
opinions then current concerning the 
application of probability principles to 
the theory of estimation. 

Centering around the main article, a 
set Of related articles by other leading 
specialists in the sampling field clarify or 
illustrate Neyman's contribution to the 
tremendous advancement in the theory of 
statistical estimation and in the application 
of stratified sampling which followed the 
paper discussed in 1934 at the Royal 
Statistical Society session. 

The Editor of Estadística hopes that the 
present issue of the Journal will achieve 
the purpose it intends to serve of making 
available to the readers interested in the 
subject reference material of value to their 
activities whether at the scientific or at 
the practical level. 


The Editor of the Journal is grateful 


for the valuable collaboration of Dr. O. 


Alexander de Moraes, Assistant Secretary 
General of the Inter American Statistical 
Institute, in the over-all preparation of 
this issue and, in particular, for his special 
assistance in maintaining the technical 
quality of the translations. 


Editor of the Journal 
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También se incluye en este número, en 
versión española, la discusión que siguió 
a la presentación del estudio de Neyman. 
El tono de las críticas hechas durante la 
discusión, expresan claramente el impacto 
que ejercieron, en aquella oportunidad, 
sobre las opiniones entonces corrientes, las 
ideas expuestas por Neyman referentes a 
la aplicación de los principios probabilís- 
ticos a la teoría de la estimación. 

Alrededor del artículo principal, un con- 
junto de artículos relacionados, escritos por 
otros eminentes especialistas en el campo 
del muestreo, aclaran o ilustran la con- 
tribución de Neyman al formidable pro- 
greso observado en la teoría de la estima- 
ción y en la aplicación del muestreo estra- 
tificado que siguieron al estudio discutido 
en 1934 en la sesión de la Royal Statistical 
Society. 

La Directora de Estadística espera que el 
presente número de la Revista logre el 
propósito que se tuvo presente al poner al 
alcance de los lectores interesados en el 
asunto, material de referencia valioso para 
las actividades que desarrollen sea al nivel 
científico o al nivel práctico. 


La Directora de la Revista agradece la 
valiosa colaboración que el Dr. O. Alexan- 
der de Moraes, Secretario General Adjunto 
del Instituto Interamericano de Estadística, 
le prestó en general para la preparación 
de este número y en particular por su 
especial ayuda para mantener la calidad 
técnica de las traducciones. 


Directora de la Revista 





SOBRE LOS DOS ASPECTOS 
DIFERENTES DEL MÉTODO REPRESENTATIVO: 
EL MÉTODO DE MUESTREO ESTRATIFICADO Y 

EL MÉTODO DE SELECCIÓN DIRIGIDA* 


JerzY NEYMAN E.U.A.?*?* 


* Traducción del artículo, “On the Two Different Aspects of the Representative Method: 


The Method of Stratified Sampling and the Method of Purposive Selection,” publicado en el 
Journal of the Royal Statistical Society, parte IV, 1934, págs. 558-625. 


e. Nota biográfica: El Prof. Neyman nació en Bendery, Rumania, el 16 de abril de 1894. 
Obtuvo el grado de Bachiller en Artes en la Universidad de Cracovia, Rusia (1916) y se doctoró 
en Filosofía en Varsovia, Polonia (1923). Becado por la Fundación Rockeffeller estudió en Londres 
(1925-26) y en París (1926-27). Fue becario de la Fundación Guggenheim (1957-58) y recibió 
de la Universidad de Chicago el grado de Doctor honoris causa en Ciencias (1959). 

En Varsovia el Prof. Neyman fue, durante los años 1923-34, jefe del laboratorio biométrico 
del Instituto Nencki y del laboratorio estadístico del Colegio Central de Agricultura; conferencista 
especial (1928-34). Desde 1934 hasta 1936 fue conferencista especial en el Colegio Universitario 
de Londres donde también fue expositor de estadística (1935-38). A partir de 1938 el Prof. Neyman 
se radicó en los Estados Unidos y desde esa fecha estuvo encargado del laboratorio estadístico de la 
Universidad de California, llegando a ser designado su director en 1941. Trabajó con el Comité 
de Investigación de Defensa Nacional (1942-45), con la Universidad de Columbia (1946) como 
profesor visitante, con el Instituto Nacional de la Salud (octubre-noviembre 1958) como científico 
visitante para investigaciones en carcinogénesis y como profesor residente en el Instituto Miller para 
la investigación científica básica. En 1944, el Prof. Neyman se naturalizó ciudadaro de los 
Estados Unidos. 

Actualmente, además de su posición como directo del Laboratorio de Estadística de la 
Universidad de California, el Prof. Neyman trabaja con la Oficina de Proyectos de Investigaciones 
Navales (desde 1948) y es el director de un proyecto subvencionado por el Instituto Nacional de 
la Salud (desde 1953). Es miembro de numerosas sociedades matemáticas y estadísticas. Su campo 
especial de estudios ha versado sobre teorías de pruebas de hipótesis y de estimación y su aplicación 
a la biología, experimentación, astronomía, diagnósticos médicos, tratamiento estadístico de experi- 


mentos agrícolas. El Prof. Neyman ha escrito varios libros y más de 100 artículos que han aparecido 
en diversas revistas científicas. 
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SUMMARY 


In this work Dr. Neyman deals with the theory and the 
practice of the representative method. 

The problem of the representative method is par excellence 
the problem of statistical estimation. We are interested in 
characteristics of a certain population, say ”, which it is either 
impossible or at least very difficult to study in detail, and we 
try to estimate these characteristics basing our judgment on 
the sample. Until recently it has been usually assumed that 
the accurate solution of such a problem requires the knowledge 
of probabilities a priori attached to different admissible 
hypotheses concerning the values of the collective characters of 
the population r. 

The author treats each question from two points of view: 
(a) The population * is supposed to be known; the question 
to be answered is: What could be the samples from this popula- 
tion? (b) We know the sample and are concerned with the 
probabilities a posteriori to be ascribed to different hypotheses 
concerning the population. 

In sections which Dr Neyman classifies as (a) we are on the 
safe ground of classical theory of probability, reducible to the 
theory of combinations. In sections (b), however, we are met 
with conclusions based, inter alia, on some quite arbitrary 
hypotheses concerning the probabilities a priori. 

There are two different aspects of the representative 
method—one is called the method of random sampling and the 
other the method of purposive selection. This is a division into 
two very broad groups and each of these may be further 
subdivided. 

Dr. Neyman raises the question at the beginning of the 
paper, as to whether the idea of a certain equivalency of the 
two aspects of the representative method is really justified. He 
considers both the theory and the practical results obtained by 
both methods. 

The popularity of the representative method is partly due 
to the general crisis, to the scarcity of money and to the necessity 
of carrying out statistical investigations connected with social life 
in a somewhat hasty way. The results are wanted in some few 
months, sometimes in a few weeks after the beginning of the 
work, and there is neither time nor money for an exhaustive 
research . 

Following the discussion presented at the end of the 
article, the translated text is given of the recognition of priority 
which Dr. Neyman wrote concerning Prof. A. A. Tschuprow and 


which was published in a later issue of the Journal of the Royal 
Statistical Society. 


INTRODUCCIÓN 


Debido al trabajo del Instituto Internacional de Estadística, ! y tal 
vez más aún, a los logros personales del Prof. A.L. Bowley, la teoría 
y la posibilidad de aplicaciones prácticas del método representativo, han 
atraído la atención de muchos estadísticos en diferentes países. Es muy 


1 Ver “The Report on the Representative Method in Statistics”? por A. 


Jensen, Bulletin de 
PInstitut International de Statistique, XX. 1*re Livraison. 
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probable que esta popularidad del método representativo sea también 
debida, en parte, a la crisis general, a la escasez de dinero y a la necesidad 
de realizar, en forma un tanto apresurada, investigaciones estadísticas re- 
lacionadas con la vida social. Los resultados se desean en el plazo de 
unos pocos meses y a veces a las pocas semanas de haberse iniciado el 
trabajo y no se dispone de tiempo ni de dinero para realizar una investi- 
gación exhaustiva. 

Pero creo que si la estadística práctica hizo una adquisición valiosa 
con el método representativo, esto se debe principalmente al Prof. A.L. 
Bowley, quien no sólo fue uno de los primeros en aplicar este método 
en la práctica, ? sino que también escribió una memoria muy fundamental ? 
dando la teoría del método. Desde entonces, el método representativo ha 
sido aplicado con frecuencia en diferentes países y para distintos 
propósitos. 

Siendo mi tema principal la teoría del método representativo, no en- 
traré a tratar su historia, ni citaré los ejemplos de su aplicación práctica, 
a pesar de su importancia—a menos que encuentre que su consideración 
puede resultar útil como ilustración para algunos puntos de la teoría. 


Existen dos aspectos diferentes del método representativo. Uno de 
ellos se denomina método de muestreo aleatorio y el otro, método de 
selección dirigida. Esta es una división en dos grupos muy amplios y cada 


uno de ellos puede subdividirse aún más. Ambas clases de métodos fueron 
discutidas por A.L. Bowley en su libro, donde son considerados como si 
fueran equivalentes, como si fueran igualmente recomendables. Casi la 
misma actitud ha sido adoptada en el Informe de la Comisión, designada 
por el Instituto Internacional de Estadística, con el fin de estudiar la 
aplicación del Método Representativo en Estadística.* El Informe dice: 
“En la selección de aquella parte del material que va a ser objeto de 
investigación directa, puede adoptarse cualquiera de los dos principios 
siguientes: en ciertos casos será posible hacer uso de una combinación 
de ambos principios. Uno de los principios está caracterizado por el hecho 
de que las unidades que se van a incluir en la muestra son seleccionadas 
al azar. Este método es aplicable solamente cuando las circunstancias 
hacen posible dar a cada unidad individual una oportunidad igual de 
inclusión en la muestra. El otro principio consiste en que las muestras 
se forman mediante una selección dirigida de grupos de unidades que 
se supone darán a la muestra las mismas características que tiene el total. 
Habrá razón especial para preferir este método en los casos en que el 
material difiere, con respecto a su composición, de la clase de material 


2 A.L. Bowley: “Working Class Households in Reading.” Journal of the Royal Statistical 
Society, June 1913. 
3 A.L. Bowley: “Measurement of the Precision Attained in Sampling.'” Memorandum 


publicado por el Instituto Internacional de Estadística, Bulletin de l'Institut International de Statistique, 
XXI. ]*e Livraison. 


4 Bulletin de l'Institut International de Statistique, XX. 1%?” “ivraison, pág. 376. 
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que es el objeto de la experiencia de los juegos de azar y donde, por lo 
tanto, es difícil o aún imposible cumplir con la condición mencionada 
para la aplicación de la selección al azar. Cada uno de estos dos métodos 
tiene ciertas ventajas y ciertos defectos...” 

Esto fue publicado en 1926. En noviembre del mismo año, los esta- 
dísticos italianos C. Gini y L. Galvani se enfrentaron con el problema de 
la elección entre los dos principios de muestreo, cuando emprendieron la 
selección de una muestra de los datos del Censo General de Italia de 1921. 
Ya se habían elaborado y publicado todos los datos e iban a destruirse 
los formularios originales que contenían información acerca de las familias 
individuales. Para hacer posible cualquier investigación posterior, cuya 
necesidad pudiera surgir en el futuro, se decidió conservar durante un 
tiempo más largo una muestra bastante grande de los datos censales, que 
ascendiera aproximadamente al 15 porciento de ellos. 


El propósito principal del trabajo está enunciado por los autores, en 
la siguiente forma: * “Obtener una muestra que fuera representativa de 
todo el país, con respecto a sus principales características demográficas, 
sociales, económicas y geográficas.” 

Al comenzar el trabajo, los datos originales ya estaban separados por 
provincias, distritos (circondari) y comunas y los autores afirmaron que 
el método más cómodo para obtener la muestra era seleccionar los datos 
de acuerdo con la división del país en unidades administrativas. Como 
un propósito de la muestra era, entre otros, permitir que se realizasen 
comparaciones locales en el futuro, los autores expresaron la opinión de 
que la selección de la muestra efectuada empleando las unidades admi- 
nistrativas como elementos, era la única posible. 

Por varias razones que, a pesar de su existencia, los autores no des: 
criben, resultó imposible tomar como elemento de muestreo una unidad 
administrativa menor que la comuna. Tampoco juzgaron satisfactorio usar 
las comunas como unidades de selección porque (p. 3 loc. cit.5) su gran 
número (8.354) haría difícil aplicar el método de selección dirigida. Por 
esto, los autores determinaron finalmente que los distritos (circondari) 
sirvieran como unidades de muestreo. La cantidad total de distritos en 
que está dividida Italia asciende a 214. El número de distritos a ser 
incluídos en la muestra fue de 29, es decir, aproximadamente el 13,5 por- 
ciento del número total de distritos. 

Habiendo fijado en esta forma las unidades de selección, los autores 
procedieron a la elección del principio de muestreo: debía éste ser el de 
muestreo aleatorio o el de selección dirigida? Para resolver este dilema, cal- 
cularon la probabilidad 7 de que el ingreso medio de las personas incluídas 
en una muestra aleatoria de k = 29 distritos extraídos de su universo de 
K = 214 distritos, no difiriera en más del 1,5 por ciento del respectivo 
valor en el universo. Siendo muy pequeño el valor aproximado de esta 


5 Annali di Statistica. Ser. VI. Vol. IV. p. 1, 1929. 
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probabilidad, alrededor de T = 0,08, los autores decidieron que el prin- 
cipio de muestreo a elegir era el de la selección dirigida. * 

La cita del Informe de la Comisión del Instituto Internacional de 
Estadística y la elección del principio de muestreo adoptada por los esta- 
dísticos italianos, sugieren que es bastante común la idea de una cierta 
equivalencia entre los principios de muestreo aleatorio y de selección diri- 
gida. Por cuanto la teoría de la selección dirigida parece haber sido 
extensamente presentada sólo en los dos trabajos mencionados, mientras 
que la del muestreo aleatorio ha sido discutida probablemente por más 
de un centenar de autores, parece justificable considerar, cuidadosamente, 
las suposiciones básicas que sirven de apoyo a la primera. Esto es lo que 
yo intento hacer en el presente trabajo. Las consideraciones teóricas serán 
luego ilustradas con los resultados prácticos obtenidos por Gini y Galvani 
y también con los resultados de otra investigación reciente realizada en 
Varsovia, en la cual se usó el método representativo. Como resultado de 
esta discusión, puede ser que disminuya algo la confianza general que se 
ha depositado en el método de selección dirigida. 


II. TrEorRÍías MATEMÁTICAS QUE SIRVEN DE APOYO 
AL MÉTODO REPRESENTATIVO 


La teoría de las probabilidades a posteriori y el trabajo de R. A. Fisher 


Evidentemente, el problema del método representativo es par ex- 
cellence el problema de la estimación estadística. Estamos interesados en 
las características de cierta población, digamos r, que es imposible o al 
menos muy difícil estudiar en detalle y tratamos de estimarlas basando 
nuestro juicio en la muestra. Hasta hace poco tiempo se ha supuesto, 
por lo general, que la solución exacta de ese problema requiere el cono- 
cimiento de probabilidades a priori, asignadas a las diferentes hipótesis 
admisibles concernientes a los valores de los caracteres colectivos? de la 
población T. De acuerdo con ello, la memoria de A.L. Bowley puede con- 
siderarse como dividida en dos partes. Cada asunto es tratado desde dos 
puntos de vista: (a) Se supone que se conoce la población T; la pregunta 
a contestar es: ¿Cuáles podrían ser las muestras tomadas de esta población? 
(b) Conocemos la muestra y estamos interesados en las probabilidades 
a posteriori a ser atribuídas a las diferentes hipótesis relativas a la 
población . 

En las secciones que clasifico como (a) estamos en el terreno seguro 
de la teoría clásica de las probabilidades, reducible a la teoría combinatoria.* 


$ Puede notarse, sin embargo, que la elección del principio parece haber sido >redeterminada 
por la elección previa de la unidad de muestreo. 

7 Esto es una traducción de la terminología usada por Bruns y Orzecki. Cualquier característica 
de la población o de la muestra es un carácter colectivo. 

3 A este respecto, desearía llamar la atención sobre el notable trabajo del extinto L. March, 
publicado en Metron, Vol. VI. No hay prácticamente cuestiones de probabilidades y muchos teoremas 
clásicos de esta teoría se reducen a la teoría combinatoria. 
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Sin embargo, en las secciones (b) nos encontramos con conclusiones 
basadas inter alía en algunas hipótesis bastante arbitrarias, relativas a las 
probabilidades a priori, y el Prof. Bowley acompaña sus resultados con 
la siguiente afirmación: “Debe destacarse que la inferencia así formulada 
está basada en suposiciones que son difíciles de verificar y que no son 
aplicables en todos los casos.” 

No obstante, desde que se escribió el libro de Bowley, ha sido sugerido 
por el Prof. R.A. Fisher, un enfoque a problemas de este tipo que 
elimina las dificultades que representa la falta de conocimiento de la ley 
de probabilidad a priori.* Desafortunadamente, dichos trabajos han sido 
mal interpretados y la validez de las afirmaciones en ellos contenida, ha 
sido formalmente objet tada. Pienso que esto es debido principalmente a la 
forma muy condensada de explicar las ideas, que R.A. Fisher emplea y 
quizás también, al método algo difícil de tratar el problema. Evitando 
la necesidad de recurrir a las afirmaciones, un tanto vagas, basadas en 
probabilidades a posteriori, creo que la teoría de Fisher se convierte en la 
base misma de la teoría del método representativo. En la nota 1 del 
apéndice he descripto sus líneas principales, en una forma algo diferente 
a la seguida por Fisher. 

La posibilidad descubierta por R.A. Fisher, de resolver los proble- 
mas de estimación estadística, independientemente de cualquier conoci- 
miento sobre las leyes de las probabilidades a priori, hace que resulte 
superflua cualquier apelación al teorema de Bayes. 

El procedimiento completo consiste realmente en resolver el problema 
que el Profesor Bowley denominó problema directo: Dada una población 
hipotética, hallar la distribución de ciertos caracteres en muestras repeti- 


das. Si se resuelve este problema, entonces puede demostrarse que la 
solución del otro, que toma el lugar del problema de la probabilidad 
inversa, resulta de la solución del primero. 


La forma de esta solución consiste en determinar ciertos intervalos, 
que propongo denominar intervalos de confianza (ver nota 1), en los cuales 
podemos suponer que están contenidos los valores de los caracteres estima- 
dos de la población, siendo igual o menor que 1 — e (donde e es cualquier 
número 0 <«< 1 previamente escogido) la probabilidad de que una afir- 
mación de este tipo sea errónea. Denomino coeficiente de confianza al 
número €. Es importante señalar que los métodos de estimación, parti- 
cularmente en el caso de muestras grandes, que resultan del trabajo de 
Fisher son, con frecuencia, precisamente los mismos que ya tienen un uso 
generalizado. De esta manera, la mueva solución de los problemas de 
estimación consiste principalmente en la justificación rigurosa de lo que 


9 R. A. Fisher: Proceedings of the Cambridge Philosophical Society, Vol. XXVI, Parte 4, 
Vol. XXVIII, Parte 3, y Proceedings of the Royal Society, A. Vol. CXXXIX. 
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ha sido, en general, considerado como correcto en una base más o menos 
intuitiva .10 

Desearía citar aquí las palabras de Laplace, de que la teoría de la 
probabilidad es, en realidad, únicamente el buen sentido común reducido 
a fórmulas. La misma es capaz de expresar en términos exactos lo que 
las mentes profundas sienten a través de una especie de instinto, sin poder 
a veces dar buenas razones sobre sus creencias. 


La elección de los estimadores 


Puede observarse sin embargo, que queda la cuestión de la elección 
de los caracteres colectivos de las muestras, que puedan ser más adecuadas 
para el propósito de la construcción de los intervalos de confianza y, por 
consiguiente, para los fines de la estimación. Los requerimientos con res- 
pecto a estos caracteres en la estadística práctica, pueden ser formulados 
de la siguiente manera: 


1, Ellos [los caracteres] deben seguir una distribución de frecuencias que ya 
esté en tablas o que pueda ser calculada fácilmente. 


2. Los intervalos de confianza resultantes deberán ser tan estrechos como sea 
posible. 


El primero de estos requerimientos es algo oportunístico, pero creo 
que en cuanto concierne al trabajo práctico, esta condición deberá tenerse 
presente .*! 


Los caracteres colectivos de las muestras, que satisfacen las dos con- 
diciones antes citadas y que pueden usarse en los casos más comunes, son 
suministrados por el elegante método de A.A. Markoff, 1? usado por él 
al tratar la teoría de los mínimos cuadrados. El método no es nuevo, pero 
como fue publicado en idioma ruso no es generalmente conocido.!** Este 


Lamento que la extensión necesariamente limitada del trabajo, no me permita entrar 
en detalles sobre este importante asunto. El mismo ha sido ampliamente estudiado por R.A. Fisher. 
Sus resultados a este respecto forman una teoría que él denomina Teoría de la Estimación. El 
problema arriba mencionado de los intervalos de confianza, es considerado vor R.A. Fisher como 
algo semejante a un capítulo adicional a la Teoría de la Estimación, siendo tal vez de menor 
importancia. No concuerdo, sin embargo, en este sentido con el Prof. Fisher. Me inclino a pensar 
que la importancia de sus logros en los dos campos, está en una relación que es inversa con lo 
que él mismo piensa. La solución del que he descripto como problema de los intervalos de confianza, 
ha sido buscada por las mentalidades más grandes, desde el trabajo de Bayes, hace 150 años. 
Cualquier texto reciente sobre la teoría de probabilidades incluye grandes secciones concernientes 
a este problema. Estas secciones están plagadas con toda clase de “paradojas,” etc. Creo que la 
presente solución significa no menos que una revolución en la teoría de la estadística. Por otro lado, 
el problema de la elección de estimadores tiene—hasta donde buedo ver—una importancia principal- 
mente práctica. Si éste no se resuelve adecuadamente (conviniendo en que el problema de los 
intervalos de confianza ha sido resuelto correctamente) los intervalos de confianza resultantes serán 
innecesariamente amplios, pero nuestras afirmaciones acerca de los valores de los caracteres colectivos 
estimados seguirán siendo correctas. Por esto pienso que los problemas de la elección de estimadores, 
son más bien de caracter técnico y, por supuesto, extremadamente importantes desde el punto de 
vista del trabajo práctico, pero su importancia no puede compararse con la de otros resultados 
de R.A. Fisher, concernientes a la base misma de la teoría estadística moderna. Estos son, por 
supuesto, “juicios calificativos,”” que pueden ser defendidos y atacados pero que cualquiera puede 


aceptar o rechazar de acuerdo con su punto de vista personal y con su perspectiva sobre la teoría 
de la estadística. 
1 La posición es diferente si consideramos la cuestión desde el punto de vista de la teoría. 


Aqui tengo que mencionar los importantes trabajos de R.A. Fisher sobre la teoría de verosimilitud. 
0 A.A. Markoff: Cálculo de Probabilidad. En ruso. Edición IV, Moscú, 1923. Hubo una 
edición en alemán de este libro, Leipzig, 1912, que actualmente está agotada. 


13 Dudo, por ejemplo, que Bowley, Gini y Galvani tuvieran conocimiento de esto cuando 
escribieron sus trabajos 





594 IASI, EstaDísTICA, DICIEMBRE 1959 


método, combinado con algunos resultados de R.A. Fisher y de E.S. 
Pearson concernientes a la generalización de la distribución de “Student” 
nos permite establecer hasta sus últimos detalles, la teoría de los diferentes 
aspectos del método representativo. 


Supongamos que $ es un determinado carácter colectivo de una 
población r 


Ti, T2,-..., Tn (1) 
es la muestra proveniente de esa población. Diremos que la función de 
estas 2, 

0 = 0'(2,, L2, ..., Tn) (2) 


es un “estimador de la esperanza matemática” 1* * de 6, si el valor medio 
de 6” en muestras repetidas es igual a 9. Además, diremos que la estima- 


ción 6” es la mejor estimación lineal de € si es lineal con respecto a z, 
es decir, 


, Mm: 

O =A123+ A+... +A 7. + (3) 
y si su error estándar es menor que el error estándar de cualquier otra 
estimación lineal de 4. 


Por supuesto, el usar las palabras “mejor estimador” no quiere signi- 
ficar que el estimador definido posea ventajas inequívocas sobre todos 


los otros. Esto es solamente una convención y, mientras se tenga presente 
la definición, ella no causará ningún malentendido. Mas aún, los mejores 
estimadores lineales tienen algunas ventajas importantes: 


l. Sin es grande, en la práctica su distribución sigue siempre, estrechamente la 
ley normal de frecuencias. Esto es importante, por cuanto al aplicar el método repre- 
sentativo a las estadísticas sociales y económicas, estamos tratando corrientemente con 
muestras muy grandes. 

2. En la mayoría de los casos ellos son hallados fácilmente aplicando el método 
de Markoff. 

3. El mismo método proporciona el estimador de sus errores estándares. 

4. Si el estimador 6” de 4 es lineal y si u es el estimador de su error estándar, 
entonces, en los casos en que la población muestreada está distribuida normalmente, 
la razón 

"-0 


M 


(4) 


sigue la distribución de “Student,” la cual depende sólo del tamaño de la muestra. 
Este es el resultado debido a R. A. Fisher. Además, R. A. Fisher ha suministrado tablas 
que dan los valores de t, tales que la probabilidad de que ellos sean sobrepasados 
por |9” — 6| /u tiene valores definidos tales como 0,01; 0,02; ... etc. Esta tabla* fue 
publicada mucho antes que cualquiera de los trabajos que tratan sobre la solución del 
problema de la estimación independiente de las probabilidades a priori. Sin embargo, 
esta solución ya está contenida en la tabla. En realidad ella conduce directamente a 


1 En lo que sigue sólo consideraremos los estimadores de este tipo. 


* Nota editorial: La denominación '““mathematical expectation estimate” que el autor emplea es 
sinónima de la expresión, más moderna, “unbiased estimator” que se traduce por “estimador 
insesgado.”” 

15 R.A. Fisher: Statistical Methods for Research Workers. Londres, 1932, Edición IV. 
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la construcción de los intervalos de confianza. Supongamos que el coeficiente de confianza 
elegido sea e — 0,99. De la tabla de Fisher obténgase el valor de t, digamos te, 
correspondiente al tamaño de la muestra, con el cual estamos trabajando, y a una 
probabilidad igual a 1 — «e = 0,01 de que ¿¿ sea excedido por |9” — 6| / y, Puede entonces 
demostrarse fácilmente que el intervalo de confianza correspondiente al coeficiente 
e = 0,99 y a los valores observados de $” y de u, estará dado por la desigualdad 


O0—ute<0=<0 + ute (5) 


5. La afirmación anterior es rigurosamente cierta si la distribución de las zx €es 


normal. Pero, como lo ha demostrado experimentalmente E. S. Pearson,** el resultado 
anterior es muy aproximadamente cierto para varias estimaciones lineales correspon- 
dientes a distribuciones bastante asimétricas, siempre que la muestra con la que estamos 
tratando no sea demasiado pequeña, por ejemplo, no menor que 15 elementos indivi- 
duales. Es evidente que cuando se aplica el método representativo a problemas sociales, 
ésta limitación carece de importancia. En realidad, si las muestras son muy grandes, 
las mejores estimaciones lineales siguen la ley normal de frecuencias y el multiplicador te, 
de la fórmula que da el intervalo de confianza, puede determinarse empleando cualquier 
tabla de la integral de la normal, *” 


Las propiedades anteriores de los estimadores lineales los hacen suma- 
mente valiosos, desde el punto de vista de su uso, cuando se emplea el 
método representativo. Trataré ahora el método de Markoff para encon- 
trar las mejores estimaciones lineales. 


El método puede aplicarse bajo las siguientes condiciones, que son 
frecuentemente satisfechas en el trabajo práctico. 


Supongamos que estemos tratando con k poblaciones, 
A A (6) 
de las cuales podemos extraer muestras al azar. Sea 
"y Tini (7) 


una muestra Y, de n, individuos extraídos al azar (con o sin reposición) 
de la población r,. Sea A, la media de la población r;¡. “Tenemos que 


Ti Tio, 


.... . 2 
formular ahora alguna suposición acerca de las varianzas gf de las po- 
blaciones x,. No se requiere el conocimiento real de estas varianzas. 


, . 2 
Pero debemos conocer números que sean proporcionales a y; De esta ma- 
nera, supondremos que 


2 
90 


8 
7 (8) 


. 2 . Ñ S 
siendo o un factor desconocido y P, un número conocido. Un caso 
especial de las condiciones anteriores resultaría si se supiera que 


01=09=... = 0% (9) 
siendo desconocido el valor común de las d. 


16 “Statistical Method in the Control and Standardization of the Quality of Manufactured 


Products,” Journal of the Royal Statistical Society, Vol. XCVI, Parte 1, 1933, p. 21-60. Discusión 
del trabajo, p. 61-75. 

1 Por ejemplo, puede usarse el cuadro 1 de las Tables for Statisticians and Biometricians, 
Parte 1 de Pearson. 


18 Algunas veces, para ciertos problemas especiales, ni siquiera se necesita este conocimiento. 





IASI, EstTADÍSTICA, DICIEMBRE 1959 


Supongamos ahora que estemos interesados en los valores de uno o 
de varios caracteres colectivos de las poblaciones r;, siendo cada uno de 
ellos una función lineal de las medias de estas poblaciones, digamos 


0; = a; A+ aj2 A Ak As (10) 


donde las a son ciertos coeficientes conocidos. Markoff da ahora el mé- 
todo para encontrar funciones lineales de las x provenientes de muestras 
tomadas de todas las poblaciones, es decir, 


0; = My Tr HA 2 4 2 4 Ay, Ti, 


tales que, cualquiera sea el valor del 0, desconocido; 


(a) La media de 6', en muestras repetidas —= 0), 


(b) El error estándar de 6”, es menor que el de cualquier otra función lineal, que 
satisfaga las (a). 


Los detalles relativos a este método se dan en la nota 11 del Apéndice. 

Es digno de considerar el significado estadístico de las dos condiciones 
(a) y (b), cuando se las combina con el hecho de que si el número de 
observaciones es grande, la distribución de 6” en muestras repetidas tiende 
a ser, y para propósitos prácticos realmente es, mormal. La condición (a) 
significa que los valores más frecuentes de 6” serán aquéllos próximos a 6. 
Por lo tanto, si Y es alguna función lineal de las x, que no satisface la 
condición (a), sino la condición, 

Media y en muestras repetidas — 06 + A (por ej.), 
entonces, usando Y como un estimador de 6, comcteríamos errores siste- 
máticos que serían con mayor frecuencia próximos a A. Los estimadores 
tales como y se dice que son sesgados. 

La condición (b) nos da la seguridad de que cuando se usan las 0” 
como estimaciones de las 9, obtendremos intervalos de confianza, corres- 
pondientes a un coeficiente de confianza definido, más estrechos que 
aquéllos obtenidos usando cualquier otro estimador lineal. En otras 
palabras, usando estimadores lineales que satisfagan las condiciones (a) 
y (b), podemos estar seguros de que no cometeremos errores sistemáticos 
y que la exactitud de la estimación será la máxima. 
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II. DIFERENTES ASPECTOS DEL MÉTODO REPRESENTATIVO 


Podemos ahora entrar a considerar los dos aspectos del método re- 
presentativo. 


El método de muestreo aleatorio 


El método de muestreo aleatorio consiste, como es sabido, en tomar 
elementos al azar de la población que se tiene la intención de estudiar. 
Los elementos componen una muestra que es luego estudiada. Los resul- 
tados forman la base para sacar conclusiones relativas a la población. 
La naturaleza de la población es arbitraria. Pero nosotros nos ocuparemos 
de poblaciones de habitantes de algún país, ciudad, etc. Indiquemos esta 
población con II. Sus elementos serán individuos, de los cuales conside- 
raremos un cierto carácter x, que puede o no ser medible (por ejemplo, 
un atributo). Supongamos que deseamos estimar el valor promedio del 
carácter x, digamos X , en todos los individuos que forman la población qa 
Es evidente que en el caso en que z sea un atributo, que puede o no ser 
poseído por los individuos de la población, su valor numérico en estos 
individuos será 0 ó 1, y su valor medio X será la proporción de los indi- 
viduos que realmente poseen el atributo 7. 


El método de muestreo aleatorio puede ser de varios tipos: 


(a) La muestra, Y, que extraemos para estimar X, se obtiene tomando al azar 
individuos de la población II. El método de muestreo puede ser con o sin reposición. 
Este tipo ha sido denominado muestreo irrestricto por el Prof. Bowley. 


(b) Antes de extraer la muestra al azar de la población II, ésta se divide en varios 
“estratos,'”” digamos 


1, IM, ..., Ma (19) 


, 
y la muestra Y se compone de k muestras parciales, 


La Des > O (13) 


siendo cada una extraída (con o sin reposición) de alguno de los estratos. Este ha sido 
llamado, por el Prof. Bowley, método de muestreo estratificado. El Prof. Bowley consideró, 
- , . . 
solamente, el caso en que los tamaños m, de las muestras parciales son proporcionales 
a los tamaños de los correspondientes estratos. Por mi parte, no creo que esta restricción 


sea necesaria y consideraré el caso en que los tamaños de los estratos, es decir 


Mx Mar +. ME (14) 


y los tamaños de las muestras parciales, 


Ni rc (15) 
son arbitrarios. 


En muchos casos prácticos no pueden aplicarse los tipos de muestreo 
descriptos anteriormente. El muestreo aleatorio consiste en el método de 
incluir en la muestra elementos individuales de la población, con igual 
probabilidad para cada elemento. Las poblaciones humanas raramente 
están diseminadas en individuos separados. Ellos están en su mayoría 
agrupados. Por supuesto, existen excepciones. Por ejemplo, cuando con- 
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sideramos la población de las personas aseguradas, ellas pueden aparecer 
en los libros de las oficinas aseguradoras como unidades separadas. Esta 
circunstancia ha sido usada, entre otros, por A.B. Hill, ** quien estudió 
las enfermedades de los trabajadores textiles, utilizando una muestra alea- 
toria de personas aseguradas en ciertas sociedades reconocidas. Pero estos 
casos son aquí más bien las excepciones. El proceso de muestreo es más 
fácil cuando la población de la cual deseamos extraer una muestra no 
es una población de personas que están viviendo a varias millas de distancia 
entre sí, sino alguna población de tarjetas o de planillas de papel en las 
cuales están registrados los datos concernientes a las personas. Pero aún 
en esta posición simplificada, raramente encontramos datos sin agrupar. 
Por ejemplo, cuando tenemos que tomar una muestra de los datos del 
censo general, ellos están comunmente agrupados en una u otra forma y 
es muy difícil asegurar a cada individuo una probabilidad igual de ser 
incluído en la muestra. La agrupación de los datos del censo general—por 
razones de precisión tendremos presente este ejemplo—tiene frecuentemente 
varios grados. El grado inferior consiste, tal vez, en la agrupación de 
acuerdo con los alojamientos: los habitantes de un departamento se pre- 
sentan en una sola planilla. La siguiente agrupación puede incluir pla- 
nillas correspondientes a departamentos de varias casas vecinas, ? visitadas 
por el mismo funcionario que recolecta los datos para el Censo. Estos 
grupos son luego reunidos varias veces. Es evidente que sería prácticamente 


imposible muestrear al azar los individuos por separado a partir de datos 
sujetos a tan complejas agrupaciones. Por lo tanto, es útil considerar algu- 
nos otros tipos del método de muestreo aleatorio. 


Supongamos que la población II de M' individuos esté agrupada en M, grupos. 
En lugar de la población II podemos ahora considerar otra población, digamos r, que 
tenga como elementos los M, grupos de individuos, en que está dividida la población TT. 
Volviendo al ejemplo del Censo polaco cuyo material se ha conservado en paquetes 
que contienen los datos de los distritos estadísticos por separado, fue posible substituir 
el estudio de la población TI de M' —= 32 millones de individuos por el estudio de 
la población r de M, — 123.383 distritos estadísticos. Si existen enormes dificultades 
en muestrear individuos al azar, estas dificultades pueden disminuirse grandemente 
cuando adoptamos grupos como elementos de muestreo. Siendo esto así, es necesario 
considerar sí y cómo puede ser transformado, nuestro problema original de estimar X, 
el valor promedio del carácter x de los individuos que forman la población II, en 
un problema concerniente a la población r de grupos de individuos. 


El número que deseamos estimar es 


E 
X = M Z (2) (16) 


1] 


19 A.B. Hill: Sickness Amongst Operatives in Lancashire Cotton Spinning Mills, Londres, 1930. 

2 Esta fue la agrupación usada en el Censo General de Polonia en 1931. Los grupos 
correspondientes se denominarán “distritos estadísticos.” El número de personas en un distrito 
estadístico varió entre 30 y aproximadamente 500. 
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donde 7, representa el valor del carácter x del ¿-+ésimo individuo. Eviden- 
temente, no hay dificultad en agrupar los términos de la suma del segundo 
miembro de la encuesta anterior, de tal forma que cada grupo de términos 
se refiera a un cierto grupo de individuos de los que forman la pobla- 
ción r. Supongamos que estos grupos contienen respectivamente 


V1,0, ..., Um (17) 


individuos y que las sumas de las x correspondientes a estos individuos son 


u, U>, ... » UN (18) 


Con esta notación tendremos 


M=W+0+... +4 = Ll) (19) 


M” 


E (1) =41 +4 +... + Uy = E lu) (20) 
1= 1] 
El problema de estimar X es ahora idéntico al problema de estimar 
un carácter de la población rr, precisamente, 


7 
2, (0) 
Tenemos ahora que distinguir dos casos diferentes: (a) el número M' 


de individuos que forman la población II, es conocido, y (b) este número 
es desconocido. 


En el primer caso, el problema de estimar X se reduce al de estimar 
la suma de las u en el numerador de (21). En el otro caso, también tene- 
mos que estimar la suma de las y en el denominador, y lo que es más, la 
razón de las dos sumas. Debido a los resultados olitiiadalós por S. Bernstein 
y R.C. Geary, esto puede hacerse fácilmente si las estimaciones del nume- 
rador y del denominador en la fórmula que da X, son las mejores estima- 
ciones lineales. El teorema de S. Bernstein” se aplica a tales estimadores, 
y establece que, bajo condiciones corrientes de trabajo práctico, su distri- 
bución simultánea puede representarse mediante una superficie normal, con 
constantes fáciles de calcular. Por supuesto, existe la condición limitativa 
de que el tamaño de la muestra debe ser grande. El resultado de Geary *? 
hace entonces posible determinar la exactitud de la estimación de X cuando 
se emplea el cociente de las estimaciones separadas del mumerador y del 
denominador. 

Vemos así que si es imposible o difícil organizar un muestreo aleatorio 
de los individuos que forman la población a estudiar, la dificultad puede 
salvarse muestreando grupos de individuos. Aquí nuevamente podemos 


21 $. Bernstein: “Sur Vextension du théoréme limite du calcul des probabilités.” 
innalen, Vol. 97 


2 R. C. Geary: “The Frequency Distribution of the Quotient of Two 
Journal of the Royal Statistical Society, Vol. XCUL, Parte HI 


Mathematische 


Normal Variates. 
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distinguir los dos métodos de muestreo: el irrestricto y el estratificado, 
Es indiscutible que el último tiene una ventaja definida, tanto desde el 
punto de vista de la exactitud de los resultados, como de la facilidad para 
ejecutar el muestreo. Por consiguiente, consideraremos en adelante sola- 
mente el método de muestreo estratificado a partir de la población, r, cuyos 
elementos son grupos de individuos que forman la población II. Es digno 
de señalar que esta forma del problema es muy general. La misma incluye 
el problema del muestreo irrestricto, por cuanto éste es el caso especial 
cuando el número de estratos k = /. Incluye también el problema de 
muestrear individuos de la poblaciónII, por cuanto un individuo puede 
considerarse como un grupo, cuyo tamaño es y = /.. Veremos, más adelante, 
que el método de muestreo estratificado por grupos incluye, como caso 
especial, el método de selección dirigida. 


2. El método de selección dirigida 


El Prof. Bowley no consideró en su libro el tipo anterior (c) del 
método de muestreo aleatorio por grupos.*% En consecuencia, cuando él 
habla sobre el principio del muestreo aleatorio, se está refiriendo al mues- 
treo de individuos. De acuerdo con Bowley, el método de selección dirigida 
difiere del de muestreo aleatorio, principalmente por las circunstancias 
que “en la selección dirigida la unidad es un conjunto, tal como un distrito 
completo, y la muestra es una reunión de estos conjuntos, mientras que 


en la selección al azar la unidad es uma persona o cosa, que puede o no 
poseer un atributo, o con la cual puede estar asociada alguna cantidad 
medible. ... Además, el hecho de que la selección es dirigida implica, 
en general, que intencionalmente se está dependiendo de cierta correlación, 
la existente entre la cantidad buscada y una o más cantidades conocidas. 
En consecuencia, el examen adicional más importante de esta sección se 
refiere a la cuestión del grado en que la precisión de las mediciones se 
aumenta por la correlación y a cuál es la mejor forma de organizar una 
encuesta para maximizar la precisión.” 

De la cita de este párrafo resulta claro que la terminología del Prof. 
pres ra y la que estoy usando, no están completamente de acuerdo. En 

alidad, la circunstancia de que los elementos del muestreo no son seres 
sia aislados, sino grupos de individuos, no implica necesariamente 
una negación de la aleatoriedad del muestreo. Por esto, he creido útil 
tratar el tipo especial de muestreo aleatorio por grupos y así, en lo suce- 
sivo, no se considerará que la naturaleza de los elementos de muestreo 
constituye una diferencia esencial entre el muestreo aleatorio y la selección 
dirigida. 

La expresión selección dirigida se usará para definir el método de 
ejecución descripto por Bowley, Gini y Galvani. Este puede dividirse en 
dos partes: (a) el método para obtener la muestra y (b) el método de 
estimación de un promedio tal como X, descripto anteriormente. 


2 Aunque él lo aplicó en trabajos prácticos. 
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En el método para obtener la muestra se supone que la población 1I 
de individuos está dividida en varios distritos, en número de M, que 
forman la población r, que se conoce el número y, de individuos en cada 
distrito y, además, que para cada distrito se conoce el valor de uno o 
más caracteres numéricos, que el Prof. Bowley llama “controles.” No hay 
diferencia esencial entre los casos en que el número de controles es uno 
o más, de tal manera que consideraremos solamente el caso en el cual hay 
un control, que indicaremos con y; para el distrito ¿-ésimo. Retendremos 
nuestra notación previa y simbolizaremos con u; la suma de valores de 7, 
correspondientes al distrito o grupo i-ésimo. Consideremos luego 7; = ufo; 
o sea el valor medio del carácter x en el distrito ¿-ésimo. La hipótesis 
básica del método de selección dirigida es que los números *; están correla- 
cionados con el control y; y que la regresión de 7, sobre y; es lineal. Como 
nos tendremos que referir nuevamente a esta hipótesis, será conveniente 
describirla como hipótesis H. 

Suponiendo que la hipótesis H sea cierta, el método para formar la 
muestra consiste en la “selección dirigida” de los distritos para los cuales 
la media ponderada 


E 02) 


tiene el mismo valor, o al menos uno tan cercano como sea posible al 
de la población total, es decir Y. Se supone que el método anterior de 


selección puede suministrar una muestra bastante representativa, por lo 


menos con respecto al carácter 7. Como se sigue de la cita del trabajo 
de Gini y Galvani, también se creía que multiplicando los controles sería 
posible obtener lo que podría denominarse una muestra generalmente re- 
presentativa, con respecto a muchos caracteres. De otro modo, el método 
de selección dirigida no podría aplicarse para que suministrara una muestra 
que pudiera usarse en el futuro, para propósitos no anticipados desde el 
comienzo. 

Este es el método para obtener la muestra. Como veremos fácilmente, 
éste es un caso especial del muestreo aleatorio estratificado por grupos. 
En realidad, aunque los tres autores consideran a los distritos como grupos 
bastante grandes, con poblaciones que algunas veces alcanzan a un millón 
de personas, suponen que el número M de estos distritos no es muy pe- 
queño. En la investigación italiana este número era superior a 200. Si 
consideramos los valores del control, y, calculados para cada distrito, se- 
guramente encontraremos distritos para los cuales el valor de y es prácti- 
camente el mismo. Así, los distritos pueden agruparse en estratos, diga- 
mos, de primer orden, 


MD (23) 


correspondiendo cada uno a un valor dado de y. Ahora bien, cada uno 
de los estratos de primer orden, formados por distritos, pueden subdividirse 
en varios estratos de segundo orden, de acuerdo con los valores de y en los 
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distritos. Simbolizaremos con r,, un estrato que contenga, por ejemplo, 
M y» distritos, todos los cuales tienen prácticamente los mismos valores del 
control y y el mismo número y de individuos. Luego indiquemos con m,, 
el número de distritos pertenecientes a r,, a ser incluídos en la muestra. 
Si el principio que dirige la selección consiste solamente en el cumpli- 
miento de la condición de que la media ponderada del control, con las 
y como ponderaciones, deberá ser la misma en la muestra que en la 
población, entonces esto no significa otra cosa que un muestreo aleatorio 
de algunos m,, distritos tomados de cada estrato de segundo orden, habién- 
dose fijado los números m,, por anticipado y siendo algunos de ellos pro- 
bablemente 0. Esto es evidente, ya que los efectos de mantener la media 
ponderada Y” — Y — constante, dos distritos diferentes que pertenecen al 
mismo estrato de segundo orden, son de igual valor. En consecuencia 
seleccionamos uno de ellos al azar.?* 

Vemos así que el método de selección dirigida consiste en (a) dividir 
la población de los distritos en estratos de segundo orden, de acuerdo con 
los valores de y y de » y, (b) seleccionar al azar un número definido de 
distritos de cada estrato. El número de unidades que componen la muestra 
está determinado por la condición de mantenimiento del promedio pon- 
derado de y. Al comparar el método de selección dirigida con el de mues- 
treo estratificado por grupos, tenemos que tener en cuenta estos dos rasgos 
especiales del primero. 


IV. (COomMPARACIÓN DE LOS DOS MÉTODOS 
DE MUESTREO 


Estimaciones de Bowley y de Gini y Galvani 


Supongamos ahora que la muestra ya ha sido extraída y consideremos 
los métodos de estimación del promedio X. A este respecto, los estadísticos 
italianos no concuerdan con Bowley, por lo cual nosotros tendremos que 
considerar dos procedimentos ligeramente diferentes. No pude seguir 
exactamente el método propuesto por el Prof. Bowley. El está explicado 
con más claridad por los autores italianos, pero no tengo la certeza de si 
ellos interpretaron correctamente la idea de Bowley. Consiste en lo 
siguiente: 


Simbolizaremos con Xy la media ponderada de los valores zx, deducidos 
de la muestra 2; y con 7, la media sin ponderar de los mismos números, 
también deducidos de la muestra. Y representará la media ponderada del 
control y, que tiene ex hypothesi iguales valores para la muestra y para 
la población. y representará la media sin ponderar del control y, calculada 


2 Debe destacarse que la interpretación anterior del método de selección dirigida es necesaria, 
si intentamos tratarlo desde el punto de vista de la teoría de la probabilidad. Cuando no hay 
variación aleatoria o muestreo aleatorio, no hay cabida para las probabilidades, los errores estándares, 
etc Ahora bien, si los distritos son seleccionados de acuerdo con los correspondientes valores del 
control y y también con el número de individuos que ellos contienen, la única variable posible 
que se deja al azar es 7¡ Si los distritos son muy grandes y por lo tanto hay sólo unos pocos, 
entonces la mayoría de los estratos de segundo orden no contendrán ningún distrito o tendrán 


solamente uno. En este caso, por supuesto, el proceso de muestreo aleatorio dentro de un estrato 
de este tipo, es imaginario 
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para la población, y por último, g el coeficiente de regresión de 7, sobre y,, 
calculado en parte en base a la muestra y en parte en base a la población . 


Puede usarse Xy como una primera aproximación a la X desconocida. 
Pero es posible calcular una corrección K, que se restará de Xy, en tal 
forma que la diferencia Xy — K deberá considerarse como la segunda apro- 
ximación a X. La corrección K está dada por la fórmula 


K=-(X-D+g(Y —-7) (24) 


Como el valor de X es desconocido, puede substituirse por su primera 
aproximación Xy. En esta forma tenemos como segunda aproximación a 
X, la expresión 


X' =-X2 + (X2 - 3) - 9(Y - )) (25) 


No sé si éste es el método por el cual Bowley ha calculado las muy exactas 
estimaciones en los ejemplos que considera en su trabajo. De cualquier 
forma el método, tal como se lo ha descripto anteriormente, es inconsis- 
tente: aún cuando se aplique a una muestra que incluya el total de la 
población y aunque la hipótesis fundamental H, acerca del carácter lineal 
de la regresión de 7, en y, se satisfaga exactamente, puede dar resultados 
equivocados: 


YX (26) 


Esto puede mostrarse en el simple ejemplo siguiente. Supongamos 
que la población r zonsta solamente de cuatro distritos caracterizados pol 
los valores de %,, yí y vi como se muestra en el cuadro 1 que sigue 


CUADRO 1. 


Distritos T; Yi 


I 0,07 Y 
II 0,09 36 36 
HI 0,11 12 
IV 0,13 108 


Totales 0,40 


165 


Medias z = 0,100 y= . X =0,114 Y = 0,110 


En razón del hecho de que el control y tiene sólo dos valores diferentes, 
0,09 y 0,12, no hay problema con respecto a la hipótesis H referente al 
carácter lineal de la regresión, que por cierto se satisface. La línea de 
regresión pasa a través de los puntos con coordenadas (y = 0,09; x = 0,08) 
y (y = 0,12; x = 0,12). Así, el coeficiente de regresión es g = 4/3. 
Supongamos ahora que tenemos una muestra extraída de la población 





604 IASI, EsTADÍSTICA, DICIEMBRE 1959 


anterior, que incluye a la totalidad de la misma, y calculemos la estima- 
ción X” de X — 0,114. Tendremos 


Xx 0,114 
+ (X3 — 3) 0,014 


= g(Y — y = 0,007 


XxX" = 0,121 
que no es igual a 


Xy = 0,114 


Gini y Galvani aplicaron el método de Bowley para estimar la tasa 
promedio de crecimiento natural de la población en Italia, usando una 
muestra de 29 distritos, de entre 214. Obtuvieron resultados que juzgaron 


no satisfactorios y propusieron otro método de estimación. Este consiste 
en lo siguiente: 


Comienzan por hallar lo que podría llamarse la ecuación de regresión 
ponderada. Si existen varios controles, digamos yW, y%, ..., y", la 
ecuación de regresión ponderada 


=b.+by" +b2y9 +... +b,y"” (28) 


se encuentra minimizando la suma de cuadrados 


Ev (e; —d, dy? — da 84) (29) 
con respecto a los coeficientes bo, bi, ba, ..., b,. Este proceso se derivaría 
de las fórmulas corrientes si supusiéramos que un distrito con una cantidad 
de individuos y, y un carácter promedio 7, es equivalente a y, individuos, 
que tengan, cada uno, el mismo valor del carácter 2 =7,. Habiendo 
señalado este hecho, no es necesario seguir más adelante con los cálculos. 
Si hay solamente un control, y. entonces, la ecuación de regresión ponde- 
rada diferirá de la ordinaria en que contendrá medias ponderadas prove- 
nientes de muestras, tanto de Z, como de y, en lugar de las medias no 
ponderadas y en que, en la fórmula del coeficiente de regresión, tendremos 
sumas ponderadas en lugar de sumas sin ponderar. Gini y Galvani utilizan 
luego la ecuación de regresión ponderada, para estimar el valor de Z, para 
cada distrito, ya sea que esté o no incluido en la muestra. Esto se hace 
sustituyendo en la ecuación los valores del control y, correspondientes 
a cada distrito y calculando el valor de la variable dependiente. Las 
estimaciones de las medias 7, así obtenidas, es decir 7”, son las utilizadas 
para calcular su media ponderada 


- 2, (0; 2,) 
XxX = === 30 
y (v;) 


que se considera como una estimación de la media desconocida X. 
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El simple análisis matemático de la situación comprobó que (ver nota 
III) este estimador es consistente cuando se cumple una hipótesis especial 
H", referente al carácter lineal de la regresión de 7, sobre y; y además que 
es el mejor estimador lineal bajo una condición adicional H, referente a la 
variación de las 7, en estratos correspondientes a diferentes valores fijados 
de y y de y. 

La hipótesis H' consiste en la suposición de que la regresión de Z 
sobre y es lineal, no sólo si consideramos la totalidad de la población * 
de los distritos, sino también si consideramos solamente los distritos com- 
puestos por un número fijo de individuos. Puede verse que la hipótesis H' 
es todavía más limitativa que la hipótesis H. 

La otra condición, H,, es la siguiente. Consideremos un estrato 
definido por los valores y = y' yv = v” y consideremos los distritos que 
pertenecen a este estrato. Sean 


A A (31) 


los valores de las medias z correspondientes a estos distritos. La hipóte- 
sis H, bajo la cual el estimador de X, propuesto por Gini y Galvani, es 
el mejor estimador lineal, consiste en la suposición de que el desvío están- 
dar, es decir o” de las 7, correspondientes al estrato rm” puede expresarse 
mediante la siguiente fórmula 


o 


YT 82 


siendo 9 una constante, independiente del valor fijado de y = y”. Esta 
hipótesis sería justificable, si la población de cada distrito pudiera consi- 
derarse como una muestra aleatoria de la población total TI. En realidad, 


en ese caso la desviación estándar de las medias 7,, correspondientes a los 


distritos que tienen su población igual a y sería proporcional a v 
La población de un solo distrito no es por cierto una muestra aleatoria de 
la población del país, por lo cual el estimador de Gini y Galvani no 
es el mejor estimador lineal—por lo menos en la mayoría de los casos. 
Habiendo llegado a este punto, podemos considerar si, y en qué me- 
dida, existe justificaci ión para el principio de elegir la muestra en forma 
tal que la media ponderada del control, en la muestra, sea igual a la 
media ponderada de la población. El criterio adecuado para juzgarlo, 
parece ser el error estándar de la estimación de X”. Este viene dado por 
una función (ver nota 111) que, ccoeteri paribus, asume valores menores 
cuando la media ponderada del control, calculada en base a la muestra, 
es igual a su valor en la población y cuando la suma de las ponderaciones 
Mi») calculada para la muestra, tiene el mayor valor posible. De esta 
manera, queda justificado el principio de selección dirigida. El análisis 
realizado en la nota III sugiere también que si se fija el número de 
distritos a ser incluídos en la muestra, obtendremos una mayor exactitud 
eligiendo distritos más grandes, que la que se lograría seleccionando los 
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más pequeños. Sin embargo, esta conclusión depende principalmente de 
las suposiciones hechas con relación a las desviaciones estándares dentro 
de los distritos, y del carácter lineal de la regresión. 


2. Las hipótesis que sirven de apoyo a ambos métodos y las condiciones 
del trabajo práctico 


Podemos considerar ahora las preguntas: (1) ¿Es probable que encon- 
tremos en la práctica casos en los cuales se satisfagan las hipótesis que 
sirven de apoyo al método de selección dirigida, es decir, la hipótesis H' 
relativa al caráter lineal de la regresión y la hipótesis H, concerniente a 
la variación del carácter buscado, dentro del estrato de segundo orden? 
(2) Si encontramos casos en los cuales estas hipótesis no se satisfacen exac- 
tamente, ¿cuál sería entonces el resultado de ignorar este hecho y aplicar 
el método de selección dirigida? (3) ¿Es posible lograr algún método mejor 
que el de selección dirigida? 2 

Con respecto a (1), no dudo que sea posible encontrar casos en los 
cuales la regresión de un cierto carácter z;, sobre el control y;, sea bastante 
cercana a la lineal. Este puede ser el caso especialmente cuando uno de 
los caracteres Y e y es una función lineal del otro, por ejemplo, si 7 es la 
tasa de crecimiento natural de la población e y la tasa de natalidad. 
Este es el ejemplo considerado por Gini y Galvani. Sin embargo, pienso 
que este ejemplo es algo artificial. Cuando se conoce y para cualquier 
distrito, en la mayoría de los casos tendremos, probablemente, todos los 
datos necesarios como para poder calcular la T sin recurrir al método 
representativo. Empero, en otros casos en que la conexión entre el carácter 
buscado y el posible control no es tan directa, creo que es bastante peli- 
groso suponer cualquier hipótesis definida concerniente a la forma de la 
línea de regresión. He derivado la regresión del ingreso medio zx; de las 
personas que habitan en diferentes distritos, sobre el primero de los con- 
troles usados por Gini y Galvani, es decir, la tasa de natalidad y;. Las 
figuras I y II presentan, respectivamente, el diagrama aproximado de 
puntos correspondiente a la tabla de correlación de aquellos caracteres y 
el gráfico de la línea de regresión ponderada de 7, e y;¡. Debe recordarse 
que los datos se refieren a la población en su totalidad y por lo tanto 
el gráfico representa la “verdadera” línea de regresión. Esta está muy 
lejos de ser recta. Por supuesto, es difícil juzgar con qué frecuencia encon- 
traremos en la práctica, divergencias importantes con respecto a la linea- 
lidad. Creo, sin embargo, que es mucho más seguro suponer que el carácter 
lineal no está, en general, presente y considerar el caso en que la hipótesis 
H” no se satisface. 

La hipótesis H, probablemente nunca se satisface. 


Con respecto a (2): La nota 111 muestra que el estimador de Gini y 
Galvani generalmente deja de ser insesgado cuando ya no podemos hacer 


26 Es decir, un método que no perdiera su proviedad de ser consistente cuando no se 
satisface la hipótesis H”. 
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ninguna suposición acerca de la forma de la línea de regresión de 7 sobre 
y- Dicho estimador puede mantenerse consistente sólo ajustando de una 
manera muy especial la cantidad de distritos seleccionados en cada estrato 
de segundo orden. En realidad, la consistencia requiere que el número 
de distritos, digamos m'”, a ser seleccionado de un estrato que contenga 
en conjunto M” distritos, satisfaga la condición. 


, 


m' — 2 (vw) para la muestra 
M' 2 (v) para la población 


(33) 


Cualquier alejamiento de esta regla puede introducir algún sesgo en la 
estimación . 

Con respecto a (3): No existe dificultad esencial en la aplicación del 
método de Markoff para hallar las mejores estimaciones insesgadas del 
promedio X, en base a una muestra obtenida por el método de muestreo 
estratificado por grupos. Esto se ha hecho con un detalle completo en mi 
publicación en polaco (hay un resumen en inglés)?% relativa a la teoría 
del método representativo. El principio de estratificación, es decir, de la 
división de la población original de distritos en estratos, no afecta al 
método para obtener la estimación. En cualquier caso, y cualesquiera sean 
las varianzas de las 7, dentro de los estratos, el mejor estimador lineal de X 
es siempre el mismo. 

Volveré a considerar aquí las variables introducidas anteriormente y 
usaré 


(34) 


en lugar de 7,. Supongamos que en m” unidades muestreadas de un estrato 
que contiene M” distritos, obtuvimos m” valores diferentes de u. Simboli- 
zaremos con u su media aritmética. Luego, el producto M'u será la estima- 
ción de la suma de las u para todo el estrato. Sumando estas estimaciones 
para todos los estratos, obtenemos la mejor estimación de la suma de las u 
para la población en su totalidad. Para obtener una estimación de X, 
sólo falta dividir la estimación de la suma de las u por la suma de las », 
que puede ser conocida, o ser estimada por el mismo método. De esta 
manera, la estimación final de X, es decir X”, es 


xr - E (Mu) 
' 2 (1) 


si se conocen las y para todos los distritos, o en el otro caso 


Xx” z (Mu) 

É Y (M'v) 
donde 7 representa la media aritmética de las y calculadas separadamente 
para cada estrato, a partir de la muestra. 


(35) 


(36) 


mM J. Neyman: An Oulline of the Theory and Practice of Representative Method, Applied 
in Social Research, Instituto de Problemas Sociales, Varsovia, 1933. 
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FIGURA 1. 





eE médio en miles de liras 


Tasa de natalidad 
Regresion de x sobre y 


Ingreso médio en miles de liras 





so - 18 |18 - 21/21 -2[2+-27/27-30/30-33/33-30/33-39]39-+2[12-45] 


Tasa de natalidad 


Los círculos corresponden a los distritos que forman 
la muestra. 


FIGURA Il. 
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La consistencia de los estimadores Z (M'u) y E (4'») no depende 
de ninguna hipótesis arbitraria relativa a la población muestreada. La 
única condición que debe satisfacerse es que la muestra deberá contener 
distritos provenientes de todos los estratos. Podemos, por lo tanto, aplicar 
sin riesgos estos estimadores, cualesquiera sean las propiedades de los 
estratos individuales, e independientemente de las variaciones de las u y 
de las v, dentro de los estratos. Pero, los errores estándares de los dos 
estimadores dependen, ciertamente, tanto de la variabilidad de los carac- 
teres de los distritos, dentro de los estratos, como de la relación entre 


los números m” y M”. Es sabido que la fórmula que da la varianza, diga- 
mos g?, del estimador Y (Mu), es la siguiente: 


2 Mi Mim; > 
7 AE (37) 
mi M; o y 


donde m;, y Mi, se refieren al estrato ¿-ésimo, o? es la varianza de las u 
en el estrato ¿-ésimo y la sumatoria * se extiende a través de todos los 
estratos. Es evidente la dependencia de o? sobre los a,. Si logramos dividir 
la población r en estratos que sean muy homogéneos con respecto al 
carácter u de los distritos, o; será pequeño y también lo será 02. Asimismo, 
es evidente que aumentando el número m, de distritos a ser seleccionados 
de los estratos, también mejoraremos la exactitud del estimador. Toman- 
do m; = Mi, la exactitud será absoluta, pero en ese caso tendremos una 
encuesta exhaustiva. Probablemente será necesario suponer que las con- 
diciones reales de la investigación fijan un cierto número, digamos 


m, =  (m;) (38) 
de distritos a ser seleccionados de la población. Nuestro problema con- 
sistirá entonces en distribuir el número de unidades muestrales entre los 
estratos individuales, en forma tal de tener el mínimo valor posible de a? 

Cálculos sencillos muestran que la varianza (37) puede escribirse en 
la forma 


» M.- á MS; (MS) Y 
dm tn MÍ) + E a — Ena) - 


Mo Mi Mo 


sy Y 
Mo > y, (s, de EA) (39) 


Mo 


M, 


donde Ñ representa a M, o; [  (M; — 1). Vemos que solamente el término 
central del segundo miembro depende de los valores de las m. Los otros 
términos permanecen constantes, cualquiera sea el sistema de las m, siempre 
que su suma, m,, permanezca invariable. De esta manera, el método para 
reducir el valor de a? consiste en disminuir el término central del segundo 
miembro de (39). Este toma su valor mínimo cero, cuando los números m; 
son proporcionales a los productos M¡S,. Por consiguiente, si es posible 


estimar las varianzas o; de las u dentro de cualquier estrato dado, el 
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sistema de las m, más favorable no es aquél en el cual las m, son propor- 
cionales a las M,. Indiquemos los tres términos del segundo miembro de 
(39) con A, B y — C respectivamente. Si suponemos que las m;, son propor- 
cionales a las M, entonces hallamos que el término B = C y la varianza 
o? se reduce a 


M,—m 9 
A E (M,S?) = A (40) 
Sin embargo, si las m, son proporcionales a M¡S,, entonces el término posi- 
tivo B de (39) desaparece, y obtenemos 

a =A-C (41) 
que es el valor óptimo de e?. 

Si la investigación se lleva a cabo con respecto a varios caracteres 
altamente correlacionados, de grupos que forman los elementos de mues- 
treo, entonces, por medio de una encuesta preliminar, es posible estimar 
los números S;, los cuales, si se calcularan para los diferentes caracteres 
buscados, también estarían correlacionados. En consecuencia, podríamos 
entonces, mediante una elección adecuada de los números m;,, si bien no 


reducir a cero el término central del segundo miembro de (39), por lo 
menos disminuirlo sensiblemente. 


Este fue el caso en la encuesta de Varsovia a la que ya me he referido, 
realizada por el Instituto de Problemas Sociales. El propósito de esta 
encusta fue describir la estructura de la clase trabajadora de Polonia, 
según diferentes caracteres, tales como la distribución por edades de los 
hombres y las mujeres, separadamente para casados y solteros, la distribu- 
ción del número de hijos en las familias, etc., haciendo esto por separado 
para tres categorías diferentes de trabajadores. Evidentemente, todos los 
caracteres investigados en el muestreo, están altamente correlacionados con 
el número de trabajadores de cada elemento. Como en Polonia existen 
grandes distritos en los cuales el porcentaje de trabajadores es insignificante 
y otros donde son numerosos, los números S; calculados para los diferentes 
caracteres bajo estudio, variaron dentro de amplios límites de estrato a 
estrato. En consecuencia, se hizo un ajuste de los números m;, a fin de 
disminuir las varianzas de los estimadores. 

No resulta difícil apreciar la necesidad de estos ajustes. Intuitivamente 
se presiente que no sería razonable incluir en la muestra, porcentajes 
iguales de distritos estadísticos provenientes de dos estratos A y B, en uno 
de los cuales, A, el porcentaje de trabajadores ascendiera, digamos, a un 
60 porciento, y en el otro, B, a un 5 porciento. Puede aún suponerse 
que en tales casos sería aconsejable omitir totalmente el estrato B. Sin 
embargo, no creo que esto sea siempre realmente aconsejable, por cuanto 
el número total de trabajadores del estrato B puede ser, algunas veces, igual 
o aún mayor que el del estrato A, y la estructura de las condiciones de las 
familias puede ser, en ambos estratos, muy diferente. 
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Por supuesto, este tipo de investigación es bastante especial. En mu- 
chos casos, no es probable que los caracteres bajo estudio estén altamente 
correlacionados. En otros casos—como en el trabajo de Gini y Galvani—es 
imposible establecer, en el momento de efectuar el muestreo, qué carac- 
teres de los elementos de muestreo serán objeto de investigación. Es en- 
tonces imposible cualquier ajuste en los números m;, por cuanto un ajuste 
equivocado puede dar a o? un valor mayor que el que corresponde al 
sistema de muestreo proporcional. Lo mejor que podemos hacer es mues- 
trear proporcionalmente a los tamaños de los estratos .? 

De esta manera, el principio de que los números m; deberán ser 
proporcionales a los M,, sugerido por el Prof. Bowley, es justamente el 
mejor que podría aconsejarse en el caso más general. 

Hasta este punto he considerado la posibilidad de reducir el valor 
de «a? ajustando en forma adecuada los números, m;,, de unidades de 
muestreos provenientes de diferentes estratos. En realidad, supuse que 

han fijado los distritos que forman los elementos de muestreo y su 
número total m, a ser incluído en la muestra. Ahora supondré que los 
distritos no se han fijado, con la excepción de que sus tamaños no serán 
muy diferentes y que todo lo que se conoce es que la muestra deberá 
incluir un cierto porcentaje de distritos, cualquiera sea su clase. 


En otras palabras, tengo la intención de considerar la situación en 
la cual decidimos incluir en la muestra una parte, por ejemplo, un 10 


porciento, de la población y estamos considerando la cuestión de cuáles 
deberán ser nuestros “distritos” que formarán los elementos de muestreo: 
si ellos deberán incluir por ejemplo, aproximadamente, 200 ó 20.000 
personas, etc. 

Deseo llamar la atención sobre el hecho de que estando las razones 
m;/M; fijadas en alguna forma, el valor de a? [ver (37)] depende de los 
productos M¡S; = Mío; / (M,— 1) o prácticamente, de los productos 
Mi; o, y puede estar influenciado por una elección adecuada del elemento 
de muestreo. En realidad, si consideramos dos sistemas diferentes de divi- 
sión de un estrato, sea en distritos más grandes o en más pequeños, entonces 
los valores de las u correspondientes a varios distritos pequeños que forman 
uno mayor, generalmente estarán correlacionados positivamente. Como 
resultado de esto, el valor de Mi; 0, correspondiente a una subdivisión de 
estratos en distritos más pequeños, será poa que el correspondiente a 
una subdivisión en distritos más grandes, Este punto puede ejemplificarse 
con un caso extremo. Supóngase, por ejemplo, que X representa la pro- 
porción de trabajadores agrícolas con edades entre 20 y 21 años. Entonces, 
cada individuo x de la población tendrá el valor 7 = l si es un trabajador 
agrícola cuya edad esté entre 20 y 21 años y el valor - = 0 en todos los 
otros casos. Si consideramos ahora como elementos de muestreo distritos 
estadísticos que incluyan 50 habitantes, entonces, en un estrato podemos 


F Debe recordarse que “* el tamaño del estrato” es el número M, de 


sus elementos y no 
el número de individuos. 





612 IASI, EsTADÍSTICA, DICIEMBRE 1959 


tener (en el caso más desfavorable) la mitad de los distritos compuestos 
solamente de trabajadores agrícolas con la edad fijada, teniendo por lo 
tanto u = 50, mientras que en la otra mitad de distritos u = 0. La des- 
viación estándar o, sería 25. Por otra parte, si los distritos no incluyeran 
50 personas sino por ejemplo 500, el máximo valor posible de «, sería 10 
veces mayor, es decir, 250. En este segundo caso, el término Myo; sería 
10 veces mayor que en el primero. Por supuesto, puede argumentarse 
que tomando distritos mayores disminuímos la oportunidad de que los 


mismos sean extremadamente diferentes. Esto es con certeza así, pero por 


otro lado pienso que es en extremo probable que los productos M, E cal- 
culados para distritos que incluyen decenas de miles o cientos de miles 
de habitantes, puede esperarse que sean incomparablemente mayores que 
aquéllos calculados para los distritos que incluyen, en promedio, dos o tres 
centenares de personas. Y esto es así, para la mayoría de los caracteres 
imaginables que podrían ser objeto de investigación estadística .?8 

El efecto de elegir unidades menores de muestreo puede ser grosera- 
mente ilustrado con otro ejemplo de un juego de azar, en el cual la 
probabilidad de ganar es igual a 1/2. Supongamos que disponemos de 
la suma de £ 100 para el juego, la cual podemos ya sea apostar de una 
sola vez o dividir en 100 apuestas separadas. En el primer caso es, eviden- 
temente, imposible predecir el resultado. En el otro caso, sin embargo, 


podemos estar bastante seguros de que la ganancia o la pérdida no exce- 
derá de unas £ 156 £ 20. 


En forma similar, si deseamos obtener una muestra representativa 
que ascienda, por ejemplo, al 15 porciento de la población, es mucho 
más seguro extraer una muestra de 3.000 unidades pequeñas que una de 
30 unidades grandes y esto es probablemente cierto, cualquiera que sea 
la estratificación . 


Ejemplo numérico 


Tal vez pueda resultar útil considerar un simple ejemplo numérico 
que muestre el efecto que, sobre la exactitud del método de selección 
dirigida, tiene la no-linealidad de la regresión del carácter buscado sobre 
el control. 


Consideremos los resultados de muestrear cuatro poblaciones, en una 
de las cuales la regresión ponderada de 7 sobre y es lineal y en las otras 
tres existen diversos grados de desviación con respecto a la linealidad. 
Cada una de las cuatro poblaciones está dividida en tres estratos de 


acuerdo con los valores del control y = — 1,y =0ey= + 1. Cada 


2 No sé si éstas son las razones por las cuales Gini y Galvani expresaron la opinión de 
que los resultados del muestreo por ellos realizado, habrían sido mucho mejores si el método 
de selección adoptado hubiera sido el de muestreo estratificado y si el elemento de muestreo hubiera 
sido una comuna. Parece que la razón por la cual no se aplicó este método, es que “nadie 


subestimar la dificultad en estratificar las comunas, simultáneamente con respecto a diferentes 
caracteres.” (Página 6, loc. cit. 5). 


Creo, sin embargo, que sería suficiente una estratificación 
en que se consideren los 214 distritos como estratos, conteniendo cada uno alrededor de 40 comunas, 
las cuales podrían considerarse como elementos de muestreo. Por supuesto, los resultados probable- 
mente serían aún mejores, si los elementos de muestreo fueran más pequeños que una comuna. 


podría 
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estrato contiene tres distritos. En el cuadro Il se presenta la construcción 
de la población r,, con regresión lineal ponderada. 


CUADRO 11. 


y=0 


No. del | 4 No. de | y No. del 
distrito, | distrito, 


distrito; 





Como en los cálculos reales tenemos que usar los productos 7,4; = u,, 
he omitido los valores de las T y en su lugar he dado los valores de las u. 
Es fácil ver que los valores de la población X, = Y = 0. Los promedios 
ponderados de las T, en cada estrato, están dados en la parte inferior, 
son — 9, 0, + 9 y se ve que la regresión es lineal. 

Las poblaciones r,, rz y r, pueden obtenerse de la población r, tan 
fácilmente que no es necesario describirlas en cuadros especiales. La po- 
blación r, se obtiene manteniendo invariables los estratos correspondientes 
ay=-—ley= + 1 y sumando a cada valor de u; en el estrato y =0 
el mismo número 6. Como consecuencia de esto, la media ponderada 
de 7;, es decir 7 (0) en el estrato central, se elevará a 7(0) = 3 y la 


regresión dejará de ser lineal. X tendrá ahora el valor Xy = 1. La pobla- 
ción rz se obtendrá de la población r, en la misma forma en que ésta fue 
obtenida de la población r,. En forma similar, la población r, se obtendrá 
de la población r, mediante la misma operación. Los valores de las medias 
ponderadas de las x en el estrato y= 0 y en las poblaciones, serán los 
siguientes 


x3(0) = 6, X3= 2, 


(42) 
71(0) =9, X,=3 


Luego consideré todas las muestras posibles tomadas de esas pobla- 
ciones, sujetas a las condiciones: (a) (y) = 7, es decir, el número de 
individuos incluídos en la muestra (no el número de elementos de la 
muestra) se fija por anticipado, y (b) la media ponderada del control y, 
para la muestra, deberá ser igual a su valor en la población, Y = 0. En 
el cuadro siguiente se dan los detalles de los resultados obtenidos. 
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CUADRO HI. 


Md Todas las 
Poblaciones r, 3 e 
poblaciones 


Distritos 


” 


A 


= NN yy 


Aquí, X” y X” representan las estimaciones de X: (i) obtenidas por 
el método propuesto por Gini y Galvani y (ii) calculadas en base a la 
fórmula (35). A'=X"—X y A" =X”-— X representan los errores de 
estas estimaciones. Podrá verse que la estimación X” da por lo general 
mejores resultados. Pero éste no es un punto esencial en el ejemplo, por 
cuanto es fácil construir otro en el cual la estimación X” sea la mejor. 
En realidad, la exactitud de X” está relacionada con la variabilidad de 
las u dentro de los estratos. Si en cada estrato correspondiente a diferentes 
valores de y, la variación de las u fuera muy grande, entonces los resultados 
obtenidos usando X” no serían muy buenos. Si fueramos a considerar es- 
tratos de segundo orden, la comparación entre los dos métodos, tal vez, 
podría establecerse aritméticamente. Pero esto extendería el ejemplo hasta 
el punto de hacerle perder sus propiedades ilustrativas. 

Lo que es importante destacar, es que los resultados obtenidos usando 
X” empeoran cada vez más a medida que nos apartamos de la linealidad de 
la regresión. Esta última circunstancia no afecta para nada la exactitud 
de X”,. Por otro lado, un cambio en los valores de «, afectaría a X”. 


V. CONCLUSIONES 


Retornemos ahora a la cuestión que planteé al comienzo del trabajo 
con respecto a si la idea de una cierta equivalencia entre los dos aspectos 
del método representativo, está realmente justificada. Tendremos que con 
siderar tanto la teoría como los resultados prácticos obtenidos mediante 
ambos métodos. Creo que el Prof. Bowley, que fue el primero en dar la 
teoría del método de selección dirigida, no lo ha usado en la práctica. 
La investigación más importante que conozco, en la cual se usó el método 
representativo, es la nueva encuesta sobre la vida y el trabajo en Londres 
(New Survey of London Life and Labour). Fue dirigida por Bowley, quien 
eligió el método de muestreo aleatorio por grupos. Creo que éste es un 
ejemplo de la intuición a la que se refería Laplace. 
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Los estadísticos italianos que aplicaron el método de selección dirigida 
a un número reducido (29) de distritos muy grandes, con poblaciones 
comprendidas entre, aproximadamente, 30.000 y 1.000.000 de personas, 
no encontraron que sus resultados fueran satisfactorios. La comparación 
entre la muestra y la totalidad del país, mostró, en realidad, que aunque 
los valores promedio de siete controles usados concuerdan satisfactoria- 
mente, es a menudo pobre la concordancia de los valores promedio de otros 
caracteres que no se usaron como controles. La concordancia de otras 
estadísticas, aparte de las medias, tales como las distribuciones de fre- 
cuencias, etc., es todavía peor. Esto se aplica también a los caracteres 
usados como controles. En el trabajo de Gini y Galvani, la afirmación 
de los hechos anteriores está seguida por consideraciones generales rela- 
tivas al concepto de muestra representativa. Ellos ponen en duda si es 
posible dar algún sentido preciso a las palabras “una muestra generalmente 
representativa.” Yo creo que ello es posible y también concuerdo en que 
una encuesta exhaustiva es el único método que puede dar resultados 
absolutamente verdaderos. Sin embargo, la necesidad de un método repre- 
sentativo es urgente y muchas encuestas serían imposibles si no pudiéra- 
mos usar este método. En realidad, nos vemos con frecuencia forzados 
a aplicar el muestreo para propósitos generales, en forma tal de obtener 
una muestra “generalmente representativa,” que pueda usarse para una 
variedad de propósitos diferentes. 

Si hay dificultades para definir la “muestra generalmente represen- 
tativa,” creo que es posible definir lo que podría denominarse un método 
representativo de muestreo y un método consistente de estimación. Creo 
que éstos métodos pueden definirse con exactitud, de la siguiente manera. 
Usaré dichas expresiones con respecto al método de muestreo y al método 
de estimación, si ellos hacen posible una estimación de la exactitud de 
los resultados obtenidos, en el sentido de la nueva forma del problema 
de estimación, independientemente de las propiedades desconocidas de la 
población estudiada. De esta manera, si estamos interesados en un carácter 
colectivo X de una población r, y si usamos métodos de muestreo y de 
estimación que nos permitan atribuir a toda posible muestra X, un inter- 
valo de confianza X, (2), X2 (2) tal que la frecuencia de que sea errónea 
la afirmación 


X (2) <X < X2 (2) (43) 


no exceda del límite 1 — e fijado por anticipado, cualesquiera sean las 
propiedades desconocidas de la población, yo llamaría representativo al 
método de muestreo y consistente al método de estimación. Hemos visto 
que el método de muestreo aleatorio permite hacer una estimación con- 
sistente del promedio X, cualesquiera sean las propiedades de la población. 
Eligiendo adecuadamente los elementos de muestreo, podemos trabajar con 
muestras grandes para las cuales la distribución de frecuencias de las me- 
jores estimaciones lineales es prácticamente normal, y no hay dificultades 
para calcular los intervalos de confianza. Así, puede decirse que el método 
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de muestreo estratificado es un método representativo, en el sentido que 
estoy dando a la palabra. Esto, por supuesto, no significa que siempre 
tendremos resultados correctos usando este método. Por el contrario, tienen 
que ocurrir afirmaciones erróneas de la forma (43), pero se conoce la 
frecuencia con que a la larga, las mismas aparecerán: su probabilidad 
es igual a e. 

Por otra parte, la consistencia de la estimación sugerida por Gini y 
Galvani, basada en una muestra obtenida por el método de selección diri- 
gida, depende de hipótesis que son imposibles de probar, excepto mediante 
una encuesta extensiva. 

Si estas hipótesis no se satisfacen, lo cual creo es un caso bastante 
general, no estamos en condiciones de apreciar la exactitud de los resul- 
tados obtenidos. Por tanto, no es esto lo que yo denominaría un método 
representativo. Por supuesto, esto puede dar algunas veces resultados per- 
fectos, pero ello se deberá más bien a la intuición incontrolable del inves- 
tigador y a la buena suerte, que al método en sí mismo. Aun cuando se 
satisfagan las hipótesis que sirven de apoyo, debemos recordar que los 
elementos de muestreo que es posible usar cuando se aplica el método de 
selección dirigida, deben ser muy pocos en número y muy grandes en 
tamaño. En consecuencia, creo que cuando se usa este método estamos 
casi en la posición de un jugador que apuesta £ 100 de una sola vez. 

Por las razones anteriores, he aconsejado al Instituto Polaco de Pro- 
blemas Sociales que, para efectuar la encuesta sobre la estructura de la 
clase trabajadora de Polonia,?* usara el método de muestreo aleatorio 
estratificado por grupos. 

Se dividió a Polonia en 113 estratos que contenían 123.383 elementos 
de muestreo (distritos estadísticos). El número promedio de personas den- 
tro de un elemento de muestreo fue aproximadamente de 250 personas. 
Había variaciones considerables de estrato a estrato. La muestra aleatoria 
estratificada contuvo un total de 1.621 elementos, es decir, aproximada- 
mente 1,24 porciento de la población total. Todavía no estoy en condi- 
ciones de afirmar hasta que punto los resultados obtenidos son exactos, 
por cuanto aún no se han publicado los respectivos datos del Censo 
General. “Todo lo que fue posible hacer para probar su exactitud, con- 
sistió en comparar la distribución por edades de los trabajadores incluídos 
en toda la muestra, con la distribución por edades calculada en base a 
una muestra más pequeña, de 235 elementos seleccionados para una en- 
cuesta inicial que tuvo por objeto probar la variabilidad dentro de los 
estratos. Los resultados se presentan en la figura III y en el cuadro IV, 
y parecen ser satisfactorios. Sin embargo, aunque debido a los azares del 
muestreo ellos hubieran sido malos, creo que hubiera estado justificado 
en aconsejar el método de muestreo estratificado por grupos, por cuanto 
estuve en condiciones de calcular que (con una probabilidad de error igual 
al 0,01) el error de los cálculos actuariales, basado en las tablas que fueron 


22 Los resultados de esta investigación se hallan en la publicación de J. Piekalkiewicz: 
Rapport sur les recherches concernant la structure de la population ouvriére en Pologne selon la 
méthode répbresentative. Instituto de Problemas Sociales, Varsovia, 1934. 
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calculados como resultado de la encuesta, no podía exceder del 4,5 por- 
ciento. 

El Prof. O. Anderson, *% quien dirigió una encuesta sobre las condi- 
ciones agrarias en Bulgaria, ha utilizado recientemente el método 
de muestreo estratificado por grupos. El procedimiento para obtener la 
muestra con la cual él trabajó, fue más difícil, por cuanto no se trataba 
de una muestra de planillas de papel conteniendo la información necesaria, 
sino de una muestra de pueblos, en los cuales fue necesario recolectar los 


FIGURA II. 


— Muestra mavor de 1621 elementos 


---- Muestra menor de 235 elementos 
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datos originales. En realidad, la encuesta en cuestión se hizo en substitu- 
ción de un censo general agropecuario. El elemento de muestreo fue un 
pueblo. El número total de aproximadamente 5.000 pueblos se dividió 
en 28 estratos. De cada estrato se tomó, para formar la muestra, el 2 por- 
ciento de los pueblos. Sólo hay un detalle en esta encuesta que no estoy 
seguro que sea justificable. Al seleccionar los pueblos dentro de los estratos 
individuales, se prestó especial atención a la selección de pueblos que, 
de acuerdo con el último Censo General de 1926, mostraron una distri- 
bución de los diferentes caracteres de los establecimientos agropecuarios, 
similar a la del estrato en su totalidad. Creo que la variabilidad de las 


3% Bulletin de Statistique, publicado por la Dirección General de Estadística de Bulgaria, 
No. 8, 1934. 
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fincas y de los pueblos es también un carácter de su población que puede 
resultar de interés. Sin embargo, si los esfuerzos de los investigadores búl- 
garos tuvieron éxito, este carácter estaría sesgado en la muestra. 

La conclusión final que sugieren tanto las consideraciones teóricas 
como los ejemplos anteriores, es que el único método que puede aconse- 
jarse para uso general, es el de muestreo aleatorio estratificado. Si las 
condiciones del trabajo práctico lo permiten, entonces los elementos de 
muestreo deberán ser individuos. En caso contrario, podemos muestrear 
grupos que, no obstante, deberán ser tan pequeños como sea posible. 
Los ejemplos de las encuestas realizadas en Londres, Bulgaria y Polonia, 
señalan que el muestreo aleatorio por grupos no presenta dificultades 
insuperables. 


CUADRO IV. DISTRIBUCIÓN POR EDADES DE LOS TRABAJADORES POLACOS 
Hombres 
A a A A A e 5 nn TN 
Edad Muestra mayor Muestra menor 


34 


44 

49 

54 
55 — 59 
60 — 64 
65 — 69 
70 — 74 
0 Mo 


Totales....... 


Hay casos en los cuales podemos seleccionar individuos en forma 
dirigida, con gran éxito. Esta situación se presenta, por ejemplo, cuando 
estamos interesados en la regresión de alguna variable y sobre x, en cuyo 
caso la selección de individuos con valores de x que varíen dentro de lími- 
tes amplios, nos daría mayor precisión. Pero estos casos son bastante 
excepcionales. 3! 


31 Se encontrarán interesantes observaciones a este respecto en el excelente libro de M. Ezekiél: 
Methods of Correlation Analysis (1930). 
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VI. APÉNDICE 
Nota I 


Supongamos que estamos tomando muestras 2 de alguna población r. 
Estamos interesados en un cierto carácter colectivo de esta población, 
digamos 9. Simbolizamos con z un carácter colectivo de la muestra 2 
y supongamos que hemos podido deducir su distribución de frecuencia 
p (2/0), en muestras repetidas y que esto depende del carácter colectivo 
desconocido 6, de la población r. 

Los caracteres colectivos a que me estoy refiriendo, son arbitrarios. 
La situación puede ilustrarse, por ejemplo, suponiendo que el carácter 
colectivo 4 es la proporción de un cierto tipo de individuos en la pobla- 
ción r, y x es la proporción del mismo tipo de individuos en la muestra. 
La distribución de x es entonces binomial, dependiendo del valor de 6. 

Simbolizamos ahora con e(9) la distribución de probabilidad a priori 
desconocida de $. Supongamos que las condiciones generales del muestreo 
y las propiedades de los caracteres colectivos 9 y r, definen ciertos valores 
que estos caracteres pueden poseer. En el ejemplo que mencioné antes, 0, 
que es la proporción de individuos del tipo dado en la población, puede 
ser cualquier número comprendido entre 0 y 1. Por otra parte, x, que 
es la proporción de estos individuos en la muestra, por ejemplo n, podría 
tomar valores de la forma k/n siendo k un entero 0<k<Émnm. 

La nueva forma del problema de estimación del carácter colectivo 0, 
puede plantearse de la siguiente forma: dado cualquier número positivo 
e < 1, asociar con cualquier valor posible de x un intervalo 


0, (1) < 0, (1) (1) 


tal que, si aceptamos la regla de afirmar que el valor desconocido del 
carácter colectivo 4 está contenido dentro de los límites 


0, (2) <0< 0, (2) (2) 


cada vez que el muestreo real nos suministra el valor de  = <”, la pro- 
babilidad de que estemos equivocados es menor que, o a lo sumo igual a, 
l — € y esto, cualquiera sea la ley de probabilidad a priori e (6). 
Propongo que el valor de €, elegido de manera bastante arbitraria, 
se denomine “coeficiente de confianza.” Si, por ejemplo, elegimos € = 0,99 
y encontramos para cada posible zx los intervalos [9, (+), 92 (2)] que tienen 
las propiedades definidas más arriba, podríamos describir aproximadamente 
la situación diciendo que tenemos un 99 porciento de confianza en el 
hecho de que 60 esté contenido entre 0(x) y 02(x). Los números 
0,(12) y 02(x) son los que R.A. Fisher denomina límites fiduciales de 6. 
Como la palabra “fiducial” ha estado asociada al concepto de “probabili- 
dad fiducial,” hecho que ha motivado los malentendidos a que me he 
referido, y el cual en realidad no puede distinguirse del concepto ordinario 
de probabilidad, prefiero evitar el término y llamar a los intervalos 
[0,(x), 02(2)] intervalos de confianza, en correspondencia con el coefi- 
ciente de confianza €. La solución del problema así planteado es inmediata. 
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FIGURA IV. 


Consideremos el plano en el cual se trazan los ejes de coordenadas 
OX y 069. Fijemos cualquier valor posible de 6, digamos Y = 0”, y deter- 
minemos sobre la linea recta 


=P (3) 


un intervalo zx, (9”) a 23 (6”), que goce de la propiedad de que cuando 0” 
es el verdadero valor del carácter colectivo 6, la probabilidad P (0”) de 
obtener, en base a la muestra un valor x dentro de los límites 


zx, (0) < 7 < 22(0') (4) 


es mayor que, o por lo menos igual a, e. Evidentemente siempre pueden 
encontrarse los límites 2, (0) y xa (0) y esto puede lograrse en general, 
de muchas formas diferentes. Si la variable 1 es continua, entonces los 
límites x, (0”) y 22 (0”) pueden fijarse en forma tal de tener, rigurosamente, 


P(0)=e (5) 


Sin embargo, en el caso en que la variable x no es continua, por ejemplo, 
si la misma sigue la ley binomial de frecuencias, tendremos solamente 


P(0>e (6) 
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A fin de definir el problema, supondremos que el intervalo 
[x,(0”), x2(0”)] se elige de tal forma que sea el más corto posible en 
tanto se satisface la condición (6). Tal intervalo se denominará intervalo 
de aceptación correspondiente al valor elegido de e. Supongamos ahora 
que hemos hallado los intervalos de aceptación correspondientes a todos 
los posibles valores de 4. Unimos entonces todos los extremos izquierdos 
de los intervalos de aceptación con una línea continua, que puede ser 
una curva suave o un polígono. Indiquemos esta línea con ££. Otra 
línea ll, unirá los extremos derechos de los intervalos de aceptación. Las 
dos líneas LL y ll serán límites de un cierto cinturón que denominaré 
cinturón de confianza CB. 


Consideremos ahora los puntos A con coordenadas (2,0), que repre- 
sentan las combinaciones de los valores posibles de x y 6. El cinturón 
de confianza CB, tal como se ha definido anteriormente, tiene la propiedad 
fundamental de que, cualquiera sea la ley de probabilidad a priori e(6), 
la probabilidad de tener el punto A interior al cinturón de confianza, 
es igual a, o mayor que el valor elegido del coeficiente de confianza e. 
Esta probabilidad puede representarse mediante integrales o sumas que 
se extiendan a través de todas las posibles posiciones del punto 4 en el 
interior de CB, de acuerdo con las propiedades de las variables x y 0, 
que pueden o no ser continuas. Entonces si Pgy es la probabilidad que se 
está considerando, tendremos la expresión 


mo = $) / ¿(O p(rl0ddo 
CB 


z<z2,(0 


Pc = 2 e/(0) Z p(z 10) 
0 


z, (0) <z 


ra (0 


Pen = 2 e (0) plízlB dz, 
9 
zx, (0 
ó finalmente 


a 2, (0) 
PcB = / p (0) Je P (x | 0) d0 (10) 
í; (0) 


extendiéndose todas las sumas e integraciones sobre el área de CB. 
Deberá notarse que el caso en que 6 y z son proporciones de ciertos indi- 
viduos en la población y en la muestra, podría conducirnos, ya sea a la 
fórmula (8) ó a la fórmula (10), de acuerdo con las suposiciones acerca 
de la población muestreada, que puede ser finita o infinita. 

En cualquier caso, y para cualquiera de las cuatro fórmulas que pueda 
corresponder exactamente a las condiciones reales del problema, las sumas 
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y las integraciones pueden ejecutarse en el mismo orden. Primero sumamos 
(o integramos) para diferentes valores de x, esto es para los valores con- 
tenidos en el intervalo de aceptación, correspondiente a un valor fijado 
de 9. Esto nos da la probabilidad P (6) que debido a la elección especial 
del intervalo de aceptación, es > e. Substituyendo, en la fórmula que 
da Poy, la integral o la suma con respecto a x por e, obtenemos 


po = / oorma>. foma. 


poa = 2 e(0) P (0) 22 0(0) =¿ (12) 


donde la integración o la suma con respecto a O se extiende a través de 
todos los valores posibles de este carácter. Por lo tanto, la respectiva inte- 
gral o suma de (0) es igual a uno. Las fórmulas anteriores completan 
la prueba de la propiedad fundamental del cinturón de confianza. Debe 
observarse que si x es continua y se eligen los intervalos de confianza 
de tal manera que P (9) = e para todo 6, entonces, cualquiera sea la distri- 
bución desconocida a priori de 6, tendremos 


PcB e. (13) 


La construcción del cinturón de confianza es completamente indepen- 
diente de cualquier suposición arbitraria concerniente a los valores de 6. 
Si se construye el cinturón de confianza, podemos afirmar que el punto A 
caerá en el interior del cinturón. Esta afirmación puede ser errónea pero 
la probabilidad del error es igual o menos que l — e o sea tan pequeño 
como se quiera. 


La solución del problema de estimación consiste en construir el cin- 
turón de confianza y afirmar que el punto A, que representa la combina- 
ción de algún posible valor de x con algún posible valor de 9, caerá en 
el interior del cinturón. Cuando la observación nos proporcione el valor 
de x= 2”, consideraremos esto como información adicional, y esta vez 
exacta, acerca de la posición del punto A y la combinaremos con la afir- 
mación anterior (incierta) de que Á cae en el interior de CB. Trazaremos 
la línea paralela al eje de 9 correspondiente a la ecuación, 


(14) 


y encontraremos sus intersecciones con los límites ll y LL del cinturón de 
confianza. Indiquemos con 6, (2') y con 02 (x”) las coordenadas de estos 
puntos de intersección. [8, (2'), 62 (x')] será el intervalo de confianza 


, 


correspondiente a z = 2”. Estableciendo que 


0,(1)<0< 0,(12') (15) 
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cada vez que la observación nos da x = zx” podemos estar equivocados. Esto 
sucederá solamente si ocurre que el punto A está afuera del cinturón de 
confianza, pero la probabilidad de este último hecho es igual a 1 — e. 


Nota II. El método de Markoff y el teorema de Markoff sobre mínimos 
cuadrados 


La importancia del trabajo de Markoff, referente a los mejores estima- 
dores lineales, consiste principalmente, según mi parecer, en una clara 
formulación del problema. La teoría subsecuente es una cuestión de simple 
álgebra 

Supongamos que tenemos una muestra de n valores, 


E (1) 


, n 


habiendo sido extraído cada una de una población MA E A 


Indiquemos con A; y con o; la media y la desviación estándar de la po- 
blación r,. Supongamos que se conoce, además, que 


A; = Q; Pi «$ Aro P2 + ¿Qe - Ag Ps 


donde las fp son algunos parámetros desconocidos, y las a: coeficientes co- 
nocidos, siendo snm. Consideremos ahora el problema de encontrar el 
mejor estimador lineal de un carácter colectivo de la población definida 
por la ecuación 


0=b,p +b2p+...+0b,Pp, 
donde las b son coeficientes conocidos. 


El método de resolución deriva inmediatamente del enunciado del 
problema. Será conveniente usar la notación E (x) para el valor medio 
de cualquier variable x. Simbolicemos con € una función lineal de las z 


2 (A,1;) (4) 


322 La teoría desarrollada por Fisher sigue líneas algo diferentes. Se aplica solamente al 
caso descripto anteriormente, en que conocemos la distribución del carácter colectivo x=, que depende 
de un solo carácter desconocido. El método que estoy empleando parece tener la ventaja de permitir 
una generalización fácil, para el caso en que hay muchos parámetros desconocidos en la distribución 
de frecuencias de diversas variables que describe los resultados del muestreo, en tanto que nosotros 
estamos interesados solamente en el valor de algunos de aquellos. Mi método para tratar el problema, 
también parece tener la ventaja de que, cumenzando con los cálculos que dependen explícitamente 
de la ley desconocida de probabilidad a priori, indica, en forma exacta, como se está eliminando 
esta dependencia. Esta teoría ha sido expuesta parcialmente en mis conferencias en la Universidad 
de Varsovia y es en la actualidad el tópico principal de mis conferencias pronunciadas en el 
Colegio de la Universidad. Se espera que sean publicadas pronto, como edición de una serie de 
conferencias pronunciadas en el Departamento de Estadística Aplicada en el Colegio de la Universidad 
de Londres. El caso en el que p y xr son proporciones de algunos individuos en la población 
y en la muestra, se discute en el trabajo de C.J. Cloper y E.S. Pearson (ahora en imprenta) 
que presenta algunas afirmaciones interesantes acerca de la relación entre los conceptos de intervalos 
de confianza y de probabilidad a posteriori en el sentido de Bayes. Este trabajo contiene también 
gráficos con un sistema de cinturones de confianza, correspondientes a diferentes tamaños de muestras 
y a distintos coeficientes de confianza. 
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Nuestro problema consiste en determinar las A de tal forma que se tenga 
simultáneamente 


E (0) =0 (5) 


og = E(0 — 0)? = minimum (6) 


La condición (5) conduce a las siguientes ecuaciones, a las que llegamos 
tomando en cuenta (2) y (3), 


E (0) = XA E(x;) = 0 (7) 


£ 


O 


P 2 (091) + p2 2 00%) +.. FP 2 (0%) = prb) + p2d2+...+ pad, (8) 


Esta igualdad deberá mantenerse cualesquiera sean los parámetros des- 
conocidos Py, Pa, -.. , P,- Esto es posible solamente si tenemos 


E (A, 041) sm 


he A Cia) TE 


Como hay s ecuaciones lineales con respecto a n > s coeficientes desco- 
nocidos A, podemos por lo general hacer una elección entre todos los 
posibles sistemas que satisfacen la (9) para satisfacer a (6). 

Usando la fórmula conocida para la varianza de una función lineal 
de n variables x,, podemos escribir la condición (6) en la siguiente forma: 


2 2 2 

oy = 2 (4 0)+2 2 2 (4,2 0; 0,74) (10) 
Los valores de A que satisfacen a (9) y que minimizan a (10) pueden 
encontrarse fácilmente, siempre que tengamos suficiente información con 
respecto a las o, y a los coeficientes de correlación r;;. El caso considerado 
por Markoff es aquél en el cual se sabe que r;¡;= 0 y 


o O 
'. EE l ] 
0; P, (11) 


siendo P;¡ un número conocido y a? alguna constante desconocida. En este 
caso, la función (10) a minimizar, puede escribirse en la siguiente forma: 


á Ñ e 
oy =0 Es (%) (12) 


La solución de minimizar (12), o, lo que es lo mismo, de minimizar la suma 


Ae 
t 3 ) 
P, ) e 
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bajo la condición de que se satisfaga a (9), es ahora directa. Sin embargo, 
ella requiere que entre las n ecuaciones (2) que relacionan las medias A; 
con los parámetros fp, haya por lo menos s ecuaciones independientes. Si 
se satisface esta condición, la solución de todo el problema está entonces 
dada por el siguiente teorema de Markoff.* 


El mejor estimador lineal de Q se obtiene sustituyendo en (3) los 
parámetros p por funciones lineales de las x, digamos 


O o 


Cid (14) 
que se hallan minimizando la suma de cuadrados 


S = E(2%;-— aq — 2. — 0) P, (15) 


con respecto a las q consideradas como variables independientes. 


La segunda parte de este teorema tan importante nos da un estimador 
de la varianza de 0”. Indiquemos con y? el estimador de «gy, y con S, el 
valor mínimo de $ obtenido a partir de la (15) mediante substitución de 
la q por las funciones (14). Luego, de acuerdo con el resultado de Markoff 


4 S Y 
“== z — (16 
e n—8 z P; ) 


Si se conociera que P, =P2= ... =1, entonces la proporción S,' (n — s) 
sería el estimador del valor de la varianza o?, común a todas las x. Con- 
siderando el denominador de (16), reconocemos en n — s al número de 
grados de libertad—el concepto introducido por R.A. Fisher—igual al nú- 
mero de observaciones, n, menos el número de parámetros independientes. 


Los resultados anteriores se aplican al caso en que las variables (1) 
son independientes. Si su dependencia surge del hecho que ellas son carac- 
teres de individuos extraídos al azar de poblaciones limitadas, entonces 
los resultados anteriores pueden adaptarse fácilmente a este caso. 

En particular, el método de Markoff se aplica cuando estamos traba- 
jando con muestreo estratificado. 


Consideremos, por ejemplo, el problema de estimar la suma 4 — E 2 (u) 
de algunos números u asociados con los elementos de alguna población 
estratificada r. Indiquemos con r;, el ¡-ésimo estrato (¿= 1,2... k), con 
M; el número de sus elementos, con 7; la media de las u correspondientes a 
los elementos de r, y con «, su desviación estándar. Las letras u;; 
XT ¡¡ y M¡ indicarán, respectivamente, el valor de u correspondiente al ¡-ésimo 
elemento de «r,, el valor de u correspondiente al j-ésimo de los elementos 
de los elementos seleccionados de r, para formar la muestra y el número 
de r, seleccionados para la muestra. Podemos escribir ahora 


0= 1 (M,u;) (17) 


$ En realidad Markoff formuló este teorema en forma ligeramente diferente, pero esta 
diferencia no es importante y la forma elegida aquí parece más conveniente 
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Para encontrar el mejor estimador lineal de 9 escribimos 


mi 


- E z (¿Y (18) 


y luego tratamos de hallar valores de los coeficientes A tales que satisfagan 
las condiciones 


E(0) =0 (19) 
cualquiera sea el valor de € y de las Y, y 
E (0 — 0)” = minimum 


Debido a (17) y al hecho evidente que 


la condición (19) se transforma en la siguiente 


h mi 
e (=, E Ay, Aa 1) = ( 
1 1 j=1 


Esto muestra que las condiciones necesarias y suficientes que deben satis- 
facer las ) para que se satisfaga (19), cualesquier “a sean las propiedades 
desconocidas de la población, serán las siguientes: 


E (0) = Mi (i .” (23) 
J=1 


Fijado ésto, consideremos la condición (20). 


Directamente por álgebra, se obtiene para el primer miembro de (20) 
la expresión 


E y Al E y Oia 1) (24) 
09 — po Mi M;—1 i M; —1 Pe ij 1 ) 


donde », representa el valor medio de las A;; calculado en base a (23), esto es 


M 
A = — (25) 
mi 


) 


Vemos ahora que cy, se minimiza mediante un sistema de valores de », 
que satisfacen (23), en el cual, cualquiera sea ¡=1,2,...,m; 


(26) 


Debe notarse que este resultado es válido, no solamente para cualesquiera 
que sean las 1. desconocidas, sino también para cualesquiera que sean 
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las desviaciones estándares o,. De esta manera, si indicamos con Z; el valor 
medio de las x7,, para cualquier estrato, entonces la función 


/ 
eS A -.. 7 
0 = YE (M,z) (27) 
1 ] 
es el mejor estimador lineal de 9, cualesquiera sean las propiedades de la 
población. La fórmula familiar para la varianza de Q' se obtiene fácilmente 
de (24) y (25): 


M¡--m; Mio 


_———— (28) 
mi M;-—1 


El estimador de 6” es, por supuesto, el que podría sugerirse sobre una 
base puramente intuitiva. La ventaja de usar el método de Markoff con- 
siste: (i) en que evita estimadores sesgados, que algunas veces pueden ser 
usados cuando su elección está basada solamente en la intuición y (11) en 
que halla los mejores estimadores lineales. Sería algo difícil cumplir esta 
última condición sólo con una base intuitiva. 


Nota III. La consistencia y la eficiencia del 
estimador de C. Gini y L. Galvani 


Consideremos una población r de distritos, dividida en estratos r,, 
de segundo orden, de acuerdo con los valores del control y y con el nú- 
mero » de individuos en los distritos. Así, cualquier distrito del estrato A 
contiene el mismo número y de individuos y también cada distrito tiene 
el mismo valor de control y. Indiquemos con M,, el número total de distri- 
tos contenidos en r,, y con my, el número de distritos que serán incluídos 
en la muestra. Las letras u,,; y 2,,¡ simbolizarán los valores del carácter bus- 
cado x, asociado respectivamente con el distrito :-ésimo del estrato r,, y con 
el ¡-ésimo distrito de los m,,, que han sido seleccionados de ese estrato. Las 
letras U4,y y 2yy indicarán las medias de u,,; y de 2,. correspondientes al 
estrato r,, y a la muestra particular de distritos extraídos de este estrato. La 
desviación estándar de u,, se indicará con 0,,. Finalmente, X e Y repre- 
sentarán las medias ponderadas del carácter buscado x, y del control, 
calculadas para la población r en su totalidad. Las medias ponderadas 
de la muestra se simbolizarán con Xy e Yy. Simbolizaremos además con 


W=722(M,, v) (1) 
v v 


Tendremos 


1 
W Z 2, (Mn v Uyv 


y v 


Sy E E (Moy) 


y v 
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Y E (M,,0%p) 


v 


12 (Mpv) (4) 


2 2 (My) 
Yz = 22 


“ — 1; X(Mpv) (5) 


Usando esta notación, consideraremos ahora la condición necesaria que 
debe ser satisfecha por x= e y en el caso en que el estimador de Gini y 
Galvani es consistente. Esta condición se halla más fácilmente cuando 
consideramos el caso ideal en que la media ponderada de la muestra, Yy, 
es exactamente igual al valor Y en la población. En este caso, el estimador 
de Gini y Galvani se reduce a Xy. Entonces consideraremos las condicio- 
nes bajo las cuales la media de las Xy, en muestras repetidas, es igual a X 
y siempre que 


Y = Y (6) 
Suponemos que los números m,, están fijados en una u otra forma a fin 
de satisfacer (6), y consideremos el valor medio de Xy que podríamos 


obtener a partir de todas las posibles muestras correspondientes a los 
valores fijados de m),. “Tendremos 


2 2 (M0 Uv) 
E X>s = E EA eS = "Ss 4 
2) 2 2, (mM, U) Az (0) 


Ahora deseamos tener 
Xz =X (8) 
siempre que se satisfaga (6). 


Las ecuaciones (6) y (8) pueden escribirse en la siguiente forma 


22m, (y-Y)=0 (9) 
y v 

2 2 Mp0 (Uy — MX) =0 (10) 
y v 


y se ve, fácilmente, que si se requiere que se cumpla (10), siempre que 
los números m,, satisfagan a (9), es necesario que 


ty — X = A(y— Y) (11) 


siendo A una constante absoluta, independiente de y y de ». 


La condición necesaria (y evidentemente también suficiente) (11), 
referente a la consistencia del estimador de Gini y Galvani, es bastante 
peculiar. Debe hacerse notar que es más limitativa que la hipótesis H 
mencionada en el texto (pág. 601). En realidad (11) significa que la 
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regresión de x sobre y deberá ser lineal, no sólo si consideramos la pobla- 
ción total de los distritos, sino también si consideramos la parte de esta 
población que contiene solamente distritos con un número fijo y de indi- 
viduos. Además, las líneas de regresión correspondientes a las distintas 
v deberán ser iguales. Indiquemos con H" la hipótesis de que estas condi- 
ciones se cumplen. Evidentemente, si H” es cierta, entonces H también 
es cierta, pero no inversamente. 

Tal vez sea digno de destacar que Xy puede ser un estimador consis- 
tente de X para un sistema especial de las m. De hecho, simbolicemos 


Z 2 (Mp) =w (12) 
y restemos (2) de (7): 


sl , M 
XX = 13 E 


o» w W 


se ve fácilmente que si para cualquier y y y 


2 = y = constante (14) 


yv 
entonces (13) desaparece y la Xy se transforma en un estimador insesgado 
de X, cualesquiera sean las propiedades de la población. Sin embargo, 
puede notarse que el cumplimiento de (14) significa el rechazo del prin- 
cipio de la selección dirigida. 

Supongamos ahora que la hipótesis H” es cierta y hallemos el mejor 
estimador lineal de X correspondiente a cualquier sistema de las m que 
no satisfaga necesariamente la condición (6). Como los valores Too Top 
correspondientes a dos distritos extraídos del mismo estrato T,,, están corre- 
lacionados, es imposible aplicar directamente el teorema de Markoff. 
Haremos esto más adelante. No obstante, debemos comenzar siguiendo el 
método general. Representando con 6” la función lineal requerida para 
las x, tendremos 


0 ue 2 de 2 Avi Tyvi) (15) 


Ella debe satisfacer las condiciones 
E(0) = X (16) 
y si oy, representa la varianza de 0” 
oy = minimum (17) 


Ya que se conocen los valores de control para todos los distritos, podemos 
cambiar el origen de las coordenadas y suponer que Y = 0 
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De acuerdo con la hipótesis supuesta H” [ver (11)] tenemos entonces 


E (Li) = Uyw = X + Ay (18) 
donde X y A juegan el papel de los parámetros desconocidos p, conside- 
rados en la teoría del método de Markoff. Por lo tanto 


E(0)= XX E (i(X + Ay)=X EX EQ) +A Di DO) (19) 
e $ BA Y] v 1 


Los valores de las A deben elegirse de tal manera que esta última 
expresión sea idénticamente igual a X, cualquiera sea el valor desconocido 
de A. Así, tendremos 


= 221 20m) = 1 (20) 
y v 1 
= Y (y EQ) =0 (21) 
Y v 1 


Estas son las condiciones para la consistencia del estimador 6”. Con- 
sideremos ahora la condición para que él sea uno de los mejores estima- 
dores lineales. Teniendo en cuenta la correlación entre Zyv Y Tyvj la 
varianza de 6” puede escribirse en la siguiente forma, que es fácil de 
verificar 


e Es z E To (z (Avi) — 2 o (Ayoi 1] (22) 


ET 


Procedemos a minimizar esta expresión con respecto a todos los siste- 
mas de las A que satisfacen (20) y (21). Para este propósito igualaremos 
a cero las derivadas de la función 


F =0y-2aj-2809 (23) 


siendo a y $8 algunos coeficientes a ser determinados a partir de (20) 
(21). Tenemos 


9F 9 1 
—— 20.1A ni AAA 
Aoi sl e M e 


Y e Y) - 084] =0 4) 


yv 1 j=) 


La ecuación anterior E escribirse en la siguiente forma 


j=1 
la cual muestra que para cualquier ¿i= 1,2,...,m,, estando fijos el 
control y y », la Ay, tiene un valor constante, digamos »yy. Este valor puede 
obtenerse de (25) en términos de a y de $£. 
Mi (26) 
Myo 

Substituyendo este valor en (20) y (21) podremos calcular a y $8 y 
luego hallar A,, a partir de la (26). Sin embargo, es más fácil obtener 
el resultado usando el teorema de Markoff. 


Api = = (a + By) 
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Los resultados que ya han sido obtenidos nos justifican para escribir 
= YE Ap» E (%m)) = E E Ay My Em) (27) 
y P 1 y v 


y así tratar a 6” como una función lineal de las variables z,,, las cuales, 
estando asociadas con unidades extraídas de diferentes estratos, son total- 
mente independientes. El valor medio de zx, es el mismo que el de z,,,. 
igual a u,,. La varianza de 2 jr, Sip) está relacionada con la varianza de 
Xy y €s la siguiente: 


Sy = y” _— 
' Mao (Mp =D) Y Quo 


De esta manera, el problema original de encontrar una función 
lineal 6” de variables dependientes x,,¡, que satisfaga a (20) y (21) se 
reduce ahora a hallar la función lineal (27) de variables independientes 
Lyw que satisfagan las mismas condiciones. Esto puede hacerse aplicando 
el teorema de Markoff. Sin embargo, tendremos que suponer algunas 


e. Ma 3 ] 


hipótesis adicionales referentes a las varianzas 0,,. Gini y Galvani supu- 


sieron, en su trabajo, una hipótesis (pág. 63) que creo podría expresarse 
en mi terminología y notación, mediante la igualdad 


o 


2 o 
Oy = a” = constante (29) 


No hay dificultades en suponer esta hipótesis y en hallar el mejor 
estimador lineal de X, directamente del teorema de Markoff. C omparando 
(28) y (29), vemos que el papel de las ponderaciones P que intervienen en 
el teorema de Markoff, está ahora representado por las proporciones 


e 
Me da Mayo (My — 1) 
M ip — mM 


Así, la mejor estimación lineal de X se encuentra minimizando la 
suma de cuadrados 


(30) 


yo 


o w M, CN ] 
= LZ 21-90 q) Mio o — Y (31) 
Y v 


My —m 


con respecto a q, y a q2 consideradas como variables independientes. 


yv 


El mejor estimador lineal buscado 0”, será la solución para q,, obtenida 
de minimizar a (31). Se ve fácilmente que éste no es el que ha sido 
sugerido por Gini y Galvani, el cual resulta de minimizar la suma de 
cuadrados 


= E E [o — 2 — 024) 0 Ma (32) 
y v 


El estimador de Gini y Galvani resulta ser el mejor estimador lineal 
cuando suponemos la hipótesis, que se indicará con H,, de que las varian- 


zas Sin son inversamente proporcionales a vm,.. Esto podría ser cierto, 
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por ejemplo, si los distritos contenidos en cada estrato fueran muestras 
de y individuos extraídos al azar de la población II. En este caso, 
tendríamos 


(33) 


ic . 4. 2 . . dl 
Hipótesis adicionales, como ser que 0, es independiente de y € igual 
a 0”, y de que cada m,, = 1, reducirán la fórmula (28) a 


Si, == (34) 
v 
lo cual conducirá a minimizar (32) cuando se trate de obtener el mejor 
estimador lineal de X. Creo que sería excesivamente difícil encontrar, 
en las estadísticas sociales, vitales o económicas, casos en que la hipótesis H, 
fuera cierta. No obstante, ella puede cumplirse en algunos problemas de 
ingeniería. 

Deseo destacar que el problema general de estimación de cualquier 
carácter colectivo 9 de una población r, debe considerarse desde dos puntos 
de vista diferentes: (1) Dada una muestra de la población, obtenida de 
alguna manera conocida, ¿qué procedimiento aritmético nos dará un esti- 
mador insesgado y más exacto de 9? (ii) ¿ Qué método de muestreo dará 
muestras que permitan lograr las estimaciones más exactas? Estos dos 
aspectos del problema pueden encontrarse en cualquier investigación teó- 
rica relativa al método representativo. Las soluciones propuestas están 
a menudo basadas solamente en la intuición y requieren justificación 
teórica. El principio del método de selección dir igida, que aconseja la 
selección de muestras tales que las medias ponderadas de los controles deri- 
vados de las muestras, deberán ser iguales a sus valores en la población, 
es una solución intuitiva del problema (ii). Los métodos que se han pro- 
puesto para estimar la media ponderada desconocida X de la población, 
son las soluciones al problema del tipo (i). En la primer parte de la nota 1, 
he considerado las condiciones bajo las cuales se justifican las soluciones 
intuitivas del problema (i). Ahora procederé a considerar si, y en caso 
afirmativo, bajo qué condiciones, está justificada la solución del problema 
del tipo (ii). 

Para esto, supondré que se satisface la hipótesis H” y consideraré la 
varianza del mejor estimador lineal 0”, de la media ponderada desconocida 
X. Su expresión incluirá los números m,, de distritos seleccionados de 
cada estrato r,,, para ser incluídos en la “muestra. Será posible ver qué 
sistema de estos números M,,, minimizaría el valor de la varianza oo , 
de 0”. Veremos que bajo ciertas condiciones, un tanto limitativas, el sis- 


tema de los m,, que minimiza a og, será el sistema para el cual la media 
ponderada del control, derivada de la muestra, es igual a su valor en 
la población . 

Consideremos el problema en su generalización completa, y no hare- 


mos suposiciones acerca de las varianzas 0, del carácter buscado, dentro 
de los estratos de segundo orden. Esto conducirá a la expresión (28) para 
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las varianzas de los números 2Z,y. El mejor estimador lineal 9” de X se 
obtendrá minimizando la suma de cuadrados 


S=_ z (60, E y) 0, (35) 


con respecto a q, y q2. La solución se obtiene fácilmente y está dada por 
la fórmula 


- FO) (36) 
donde : 
Ap LE (0ny)-vE RON, (37) 
"lala Quay) le Za (Qu) — (Za 2 (Quer) 


La varianza de (36) está dada por la conocida fórmula 


oy > de po Año Si») 


Ella, en virtud de (37) y (28), se reduce a lo siguiente 
[2 2 (0,9) 


oy (39) 


= NN EE _5K< << AAA 
YE E (0,) YX (0,4) E E (Qu) -[E E(Q,y Y 


Considerando esta fórmula, vemos que suministrará un valor pequeño para 
9y, si logramos, por ejemplo, minimizar 


mi. LA 
Pal == 0, (40) 


y al mismo tiempo maximizar EY (Q,,). La expresión anterior (40) puede 
considerarse como una media ponderada del control, calculada para la 
muestra donde las (),, están jugando el papel de las ponderaciones. Re- 
cordando que mediante una elección adecuada del origen de coordenadas, 
hemos reducido a cero el valor de la media ponderada de la población 


,_ 22 (Mypvy) 
Y = === (41) 
2 2 (M,.0) 
vemos que el resultado anterior justificaría el principio de selección diri- 
gida, si las nuevas ponderaciones (),, fueran proporcionales a las ponde- 
raciones usadas en (4); es decir, si tuviéramos 


Ga Wi (ME, — Y _ Pp 


. : (42) 
U = Y Es C 


siendo C constante. Resolviendo (42) con respecto a C obtenemos 


M.. —m 
(O = pr MA A , a 
Ma-+- > 
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Se ve fácilmente que el segundo miembro de (43) puede ser constante 
cuando my = 1 y si los valores de 0,, son independientes de y e inversa- 
mente proporcionales a y; es decir, cuando la hipótesis H, está satisfecha. 
Evidentemente, ésta no es la única condición bajo la cual (43) es constante, 
pero es difícil formular cualquier otra hipótesis que pudiera referirse a 


los valores desconocidos de 0, 


El análisis de la fórmula (39) podría llevarse un poco más lejos, pero 
la considerable extensión de la presente nota y los resultados ya obtenidos, 
sugieren que esto puede ser superfluo. 


Las conclusiones que se obtuvieron anteriormente, pueden resumirse 
de la siguiente forma: 


(a) El estimador de Gini y Galvani es insesgado solamente si se satisface la 
hipótesis, muy restrictiva, H”. 

(b) El es el mejor estimador lineal cuando se satisface otra hipótesis todavía 
más restrictiva, H,. Esta hipótesis consiste en suponer que la variación de x= entre 
distritos incluídos en cada estrato de segundo orden r,, , depende solamente del valor 
de y y es igual a la que podría resultar si los distritos fueran muestras aleatorias tomadas 
de la población estudiada. Esta condición casi nunca se satisface. 

(c) Si la hipótesis H' es cierta, entonces el principio de selección dirigida de 
distritos, en forma tal de mantener el valor de la media ponderada del control derivada 
de la muestra, igual a su valor en la población, se justifica cuando la hipótesis H, 
es cierta. Siendo sólo ligera la dependencia de la media ponderada con respecto al 
sistema de ponderaciones, puede suponerse que este principio se satisface aproximada- 
mente, aún cuando la hipótesis H, no sea exacta. Es posible extraer de la fórmula (39) 
otras conclusiones, que pueden considerarse como correcciones al principio de selección 
dirigida. 


En cada caso particular, debe considerarse si es probable que las 
hipótesis H” y H, estén justificadas y si las divergencias a este respecto 
influirán seriamente sobre la exactitud de los resultados provenientes de 
la aplicación del método de selección dirigida. 


Será útil terminar esta nota con. una ilustración numérica de las 
suposiciones implicadas en las hipótesis H, H' y H;,. Los tres cuadros 
siguientes presentan datos referentes a tres poblaciones r,, r, y *z de 
distritos. Cada población está subdividida en dos estratos de primer orden, 
de acuerdo con los valores del control y=—1e y= +1. Cada estrato 
de primer orden está, a su vez, subdividido en dos estratos de segundo 
orden, de acuerdo con el tamaño de los distritos y =1 y y =6. (Eviden- 
temente, las unidades en base a las cuales se mide la cantidad y de personas 
incluídas en un distrito, no tienen importancia. Por ejemplo, una unidad 
puede tener 10.000 habitantes.) Los cuadros 1, II, III dan los valores 
del carácter x para cada distrito en un estrato (éstos, de acuerdo con la 
notación usada en esta Nota, se indican con u;), su media aritmética con 7 
y su variancia con q?. 
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CUADRO 1. POBLACIÓN r, 


p=] v=6 y == ] =6 
Estrato 1 Estrato II Estrato III Estrato IV 


CUADRO Ill. POBLACIÓN y 


1=1 v=6 y=]1 v=56 
Estrato 1 Estrato II Estrato III Estrato IV 


CUADRO HI. POBLACIÓN 


p= 1] v= 56 p= ] , ñ 


Estrato 1 Estrato II Estrato II Estrato IV 


U; = Uy= Uy = 0 
Uy = U5= Uy = 2 





636 IASI, EsTADÍSTICA, DICIEMBRE 1959 


Se verá que para las tres poblaciones X = Y = 0. Debido al hecho 
de que y tiene solamente dos valores diferentes, la regresión de 7 sobre y 
es lineal en todas las poblaciones y por tanto todas satisfacen la hipótesis H. 
Las poblaciones r, y ra satisfacen también la hipótesis H”. En realidad, 
las medias u en los estratos de segundo orden, no dependen del valor de +. 
Esto no sucede así en la población r¿. Aquí en los estratos correspondientes 
a v =l, el coeficiente de regresión de y sobre x es igual a 4,= 1 y en los 
estratos correspondientes a y = 6, es igual a 42 = 3. Por lo tanto, la pobla- 
ción rg no satisface la hipótesis H”. 

La hipótesis H, se satisface solamente en la población *,, pues aquí 
las varianzas o? son inversamente proporcionales a las y. 

En consecuencia, cualesquiera sean los números m,, ma, mz, my de 
distritos de la muestra seleccionados de los cuatro estratos de las poblacio- 
nes m, y ra, en tal forma que sea igual a cero la media ponderada del 
control y derivada de la muestra, el estimador de Gini y Galvani, tendrá, 
en muestras repetidas, su media igual a X —0. Si fuera m,; = ma» = mz = 
=m4= 1 entonces, en el caso de la población r,, el estimador de Gini y 
Galvani sería el mejor estimador lineal. Su varianza es igual a 3/7. Cuando 
se muestrea la población m2 en la misma forma, el estimador de Gini y 
Galvani no sería el mejor estimador lineal. En realidad su varianza sería 
igual a 31/14. Por otro lado, el mejor estimador lineal que podría dedu- 
cirse de las fórmulas (36) y (37), es decir, 


-38 wo 


tendría la varianza igual a 3/7, como en el caso anterior. 

Como la hipótesis H' no se satisface en la población rjz, es posible 
encontrar un sistema de m, tal que el estimador de Gini y Galvani tenga, 
para muestras repetidas, su valor medio distinto de X =0. Debido a la 
simetría excepcional de la población rj¿, habrá muchos sistemas de m 
mediante los cuales el estimador de Gini y Galvani será consistente. Sin 
embargo, consideremos el sistema m, =6, m2=0, m¿=0, m¿=1. Evi- 
dentemente, la media ponderada del control derivada de la muestra es 
Y2= 0. Habrá sólo tres posibles muestras correspondientes al sistema fijado 
de las m dependiendo de la elección del distrito en el cuarto estrato. La 


media de las estimaciones de Gini y Galvani, calculada para estas tres 
muestras, será 


O 


E. OCIO, 


X l 45 
13 (45) 


y no es igual a X—0. Así, para este sistema de m, el estimador de Gini 
y Galvani no es consistente. Es fácil ver que si hubiera más distritos en 
cada estrato, aumentaría el número de sistemas para los cuales el estimador 
de Gini y Galvani no sería consistente. También este número sería con- 
siderablemente mayor si la estructura de la población *z no fuera 
simétrica. 
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DISCUSIÓN SOBRE EL TRABAJO DEL DR. NEYMAN 


PROF. BOWLEY: Hay algunas personas que parecen enorgullecerse por su ca- 
rencia de conocimientos sobre las matemáticas. Nunca entendí por qué ésto debería 
ser motivo de orgullo. No creo, sin embargo, que hayan muchos que sostengan ahora 
que las matemáticas no son adecuadamente apropiadas para el estudio de los problemas 
estadísticos. Este trabajo contribuirá, en gran medida, cuando se lo estudie a fondo, 
para eliminar cualquier duda que quede acerca de que el enfoque matemático es de 
fundamental importancia. El muestreo está en el origen mismo de una gran cantidad 
de investigaciones estadísticas y, como señala el Dr. Neyman, su uso y aplicabilidad 
están creciendo; por lo tanto, es de primordial importancia práctica decidir cuál es 
el mejor método de muestreo—mejor en el sentido de que se utilizarán en la mejor 
forma posible los recursos al alcance del investigador y que habrá—si las dos cosas 
son consistentes—una inversión mínima de tiempo. 

Se encontrará que este estudio del Dr. Neyman contesta casi todas las preguntas 
que se relacionan con el planteamiento de una investigación por muestras. Un aspecto 
muy interesante del mismo, es el análisis de los problemas. No existe un método 
perfecto de muestreo; el método depende de la naturaleza del material que está disponible 
o que puede obtenerse. Para mí, este muestreo estratificado de grupos, es una nueva 
sugerencia en la clasificación. En el análisis al cual él [Neyman] se refirió en términos 
excesivamente favorables, yo había hecho distinciones en las formas en que él denominó 
ciertos métodos de muestreo, pero en efecto, me doy cuenta que el método por él 
discutido es exactamente aquél que las circunstancias me han llevado a usar o recomendar. 

En la encuesta de Londres, la unidad no fue la familia o la persona sino la 
casa—unidad que fue suministrada por las listas de que disponíamos. En la recomen- 
dación que tuve el honor de formular al Gobierno de la India, juntamente con el 
Sr. Robertson, para muestreo en muy gran escala, la unidad sugerida es el pueblo. 
En las recomendaciones, dejadas sin efecto, que hice con respecto al Censo de Población 
de 1931 acerca de un método que en realidad habia usado sobre las cifras de 1911, 
la unidad era la boleta del hogar censal, y sugerí que si se tomaba un hogar censal 
de cada quinientos en todo el país, podríamos deducir algunos de los resultados del 
Censo que hoy, después de tres años, todavía estamos esperando. Pero no creo que 
éste sea necesariamente el método apropiado para todos los problemas, ni tampoco, 
según mi entendimiento, el Dr. Neyman lo recomienda universalmente. 

Me sorprende que él [Neyman] haya pensado que cuando en 1925 examiné el 
problema del muestreo representativo para el Instituto Internacional de Estadística, 
dí a ese método, tal como yo lo defino, la misma importancia que a otros. Ciertamente, 
pensé que lo había reprobado al final del resumen de mi informe, con mi muy débil 
encomio. Estoy de acuerdo en que es difícil de formular, difícil de realizar y creo 
todavía que es muy difícil obtener una buena estimación de la precisión del resultado, 
excepto en casos más bien poco habituales. 

El segundo problema, después de considerar el material y de definir el mejor 
método de muestreo, es obtener una estimación definida sobre la precisión del mismo 
en el sentido de que cuando se tiene un resultado se sepa que puede confiarse en él, 
sin definir ese término, en un 1 porciento, o en un chelín, o en lo que sea; y es 
debido en parte a esa necesidad que un método común, parcialmente intuitivo, de 
seleccionar la muestra en base a lo evidente—de tomar el modo más que cualquier otra 
medida de posición—es irremediablemente defectuoso, porque no solamente hay difi- 
cultad en obtener un promedio, sino que no hay medios, que yo conozca, para obtener 
la precisión. 

Este método de estratificación ofrece un mejoramiento de la precisión, en la medida 
en que el mismo difiere, en cuanto a precisión, del muestreo puramente aleatorio. Si 
en realidad se ha hecho una selección estratificada y se especifica la precisión como si 
el muestreo hubiera sido puramente aleatorio, se está entonces en terreno seguro. Por 
lo general, me he contentado con tomar las cosas de esta manera por dos razones: 
(1) En los casos corrientes es muy difícil medir la precisión adicional debida a la 
estratificación, en todo caso es una tarea larguísima; y (2) (de maturaleza bastante 
diferente) he tenido que explicar y tratar de justificar los métodos de muestreo a 
lectores no técnicos y por tanto me he visto obligado a dejar de lado mucho de lo que 
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el Dr. Neyman hubiera incorporado. Pero he tratado de permanecer en terreno seguro 
y sé que lo que he dejado de lado carece de importancia. 


Este proceso de estratificación puede ser concebido o aplicado en varias formas. 
En Londres elegimos el camino más simple, tomando una casa de cada treinta, cuarenta 
o cincuenta, directamente a través de la lista, en forma tal que si se hubieran marcado 
las casas que examinamos en un mapa de Londres hubieran estado distribuídas, regu- 
larmente, en proporción con la densidad del área y estarían incluídas todas las regiones. 
Creo que solamente así esto debe atraer a todo el que estudie el problema. 


Un nuevo punto que surge en el trabajo es que una selección de las unidades a 
ser examinadas para un propósito, mo resulta necesariamente la mejor para otros. 
Como, en general, la selección debe hacerse una sola vez y en forma definitiva, ese 
punto resulta de gran importancia cuando se selecciona el método a seguir. Me com- 
place que la recomendación general para este tipo de propósito sea este muestreo alea- 
torio estratificado. 

Para dar un ejemplo, si en el caso de Londres tomamos una casa, tendremos una, 
dos o tres familias. La familia no se selecciona al azar y dentro de las familias, tampoco 
las personas se seleccionan al azar. Si en un caso la coexistencia da correlación positiva, 
ella Fr ser negativa en otro y en forma similar en lo que respecta a las relaciones 
entre las personas de la familia. Es difícil estimar el efecto de esto. Sin embargo, mi 
posición sería que debemos asegurar una selección que minimice la influencia de estas 
correlaciones desconocidas y un método, para ello, consistiría en hacer muestras sufi- 


cientemente grandes, en forma tal que las mismas no se vean afectadas por las hipótesis 
más desfavorables 


Después de las muy corteses referencias del Dr. Neyman a mi trabajo sobre la 
materia, resulta un tanto ingrato que sienta que es mi deber criticar la teoría de 
probabilidades de la sección II, parte 1 y mucho me complace que el Prof. Fisher 
esté presente, desde que es su trabajo el que el Dr. Neyman ha aceptado e incorporado. 
No estoy seguro si debo pedir una explicación o levantar una duda. Se sugiere, en el 
estudio, que el trabajo es difícil de seguir y quizás yo sea uno de aquellos que se 
desorientaron por este hecho. Sólo puedo decir que lo he leído desde el momento 
de su aparición y que ayer he leído, con gran cuidado, la explicación que sobre el 
mismo diera el Dr. Neyman. Me estoy refiriendo a los límites de confianza del Dr. 
Neyman. No estoy del todo seguro que la “confianza” no sea un “artificio de con- 
fianza.'”” Expuesto en forma simple, creo que el método es como sigue: Suponiendo 
que, en una muestra aleatoria de 1.000 unidades, haya una proporción de 1 en 10 con 
una calidad definida y que, en la población de la cual se extrajo la muestra, la 
proporción esté entre 120 y 80 por mil, entonces la probabilidad de tal ocurrencia es 
menor que 1 en 20 (aproximadamente). Por supuesto, no interesan las cifras reales. 
Ese margen entre 120 y 80 por mil se muestra en la vertical del cinturón de confianza 
en los muy ilustrativos gráficos presentados por el Dr. Neyman. ¿Nos lleva eso realmente 
más adelante? ¿Sabemos más que lo que conocía Todhunter? ¿Nos lleva ello más allá 
de Karl Pearson y de Edgeworth? ¿Nos conduce ello realmente hacia lo que necesita- 
mos—la probabilidad de que en el universo que estamos muestreando, la proporción 
esté dentro de estos determinados límites? Creo que no. Creo que estamos en la posición 
de saber sea que ha ocurrido un suceso improbable o que la proporción en la población 
está dentro de los límites. Para equilibrar estas cosas, debemos hacer una estimación 
y formarnos un juicio en cuanto a la verosimilitud de la proporción en el universo—pre- 
cisamente lo que se supone que debe eliminarse. No digo que estemos formulando 
juicios imperfectos acerca de que todo está igual a través de la posible amplitud pero 
creo que estamos formulando algunas suposiciones o que no hemos avanzado nada. 
No sé si he expresado mis pensamientos en forma suficientemente exacta, pero ésto 
no es algo que se me haya ocurrido por primera vez esta noche; trátase de una dificultad 
que he sentido desde que el método fue propuesto por primera vez. El planteamiento 
de la teoría no es convincente y hasta que no esté convencido, dudo acerca de su validez. 

Lamento que al haber presentado esta cuestión raya distraído la atención del 
estudio del Dr. Neyman, pero, desde que él ha hecho de ella. una parte integral de 
su trabajo, creo que es la oportunidad para hacer este tipo de exposición . 
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Con referencia a mi fórmula, citada en la sección IV, ecuación 24, debo admitir 


que el pasaje original es obscuro. En la notación del Dr. Neyman, y solamente con 
un control, mi estimador sería, * 


Xi = Xxz e. (Tas — Tay Yyz) 9z * %a a 

donde las a son las ponderaciones aplicadas a las x en el promedio ponderado. El se- 
gundo término es cero, si no hay correlación entre las ponderaciones y los errores e, 
provenientes de la ecuación de regresión lineal.* En otros casos K deberá considerarse 
como vinculado negativamente con el término del error, ya que el promedio ponderado 
de las e no es cero sino —K. La fórmula es entonces “consistente.” Sin embargo, 
no estoy del todo seguro que las hipótesis particulares que sirvan de apoyo al tratamiento 
del tema, sean las mejores; éste fue, en cierta forma, un trabajo pionero y debería 
haberme asombrado si no se hubiera hecho ningún progreso en el curso del tiempo 

Deseo proponer un ferviente voto de agradecimiento al Dr. Neyman por su impor- 
tantísimo trabajo. 

DR. E. S. PEARSON: Mucho me complace apoyar este voto de agradecimiento 
al Dr. Neyman y darle, hoy, la bienvenida entre nosotros. Creo que todos estamos 
complacidos en que uno de nuestros miembros del extranjero hava podido aprovechar 
la oportunidad de estar en Inglaterra, para leer un trabajo ante nosotros. 

Desearía tratar de expresar, en pocas palabras, lo que a mí me parece que es 
la contribución esencial hecha al método estadístico por el Dr. Neyman en este estudio 
y en otros que él ha efectuado. En los últimos treinta o cuarenta años, el desarrollo 
de la estadística matemática ha sido extremadamente rápido; ha estado asociado con 
toda la excitación que trae consigo el descubrimiento, el descubrimiento de la fuerza 
de nuevos instrumentos para la solución de una gran variedad de problemas. Pero en 
este rápido progreso, la intuición falló algunas veces; los instrumentos usados no siempre 
fueron los mejores, ni tampoco resultaba siempre muy claro su significado, ni el por 
qué debía usarse un instrumento con preferencia a otro. En los últimos años se ha 
hecho un esfuerzo definido tendiente a aclarar algo de esta incertidumbre en nuestro 
razonamiento estadístico. El proceso no ha finalizado; está todavía, en cierta medida, 


en la etapa de la controversia y de la discusión, pero hay principios fundamentales 
que surgen segura y firmemente 


En este proceso varios de nosotros le debemos mucho al Prof. R. A. Fisher, por 
el estímulo que hemos recibido a través de la lucha con las ideas por él expuestas. 
Si empleo deliberadamente la palabra “lucha,” creo que el Prof. Fisher no objetará 
si agrego que el estímulo es tanto mayor porque ha sido necesario luchar. 


El Dr. Neyman estimulado por estas ideas, como él mismo francamente admitió, 
ha aportado una contribución propia muy real al campo de la inferencia estadística. 
Por ejemplo, el enfoque al problema de la estimación presentado en las págs.: 593-596 
y en el apéndice 1, tiene muchísimo interés aunque en el presente estudio puede 
considerarse sólo como tema secundario de discusión respecto al asunto principal. Esta 
concepción del problema de la estimación mo es exactamente la del Prof. Fisher pero 
me parece que algo del interés reside, precisamente, en aquéllos puntos en los que hay 
diferencias. Sin embargo, no creo que sea éste el lugar apropiado para discutir las 
dudas planteadas por el Prof. Bowley, con respecto a los intervalos de confianza o 
fiduciales; ellas deben ser aclaradas, pero tal vez pueda hacerse mejor con lápiz y papel, 
alrededor de una mesa. 


Volviendo el tema central del trabajo, creo que el énfasis principal reside en la 
importancia del planeamiento lógico de'cualquier investigación; el problema particular 


4 La fórmula completa, en la notación usada por mí, puede escribirse 


X Xu + (Oz. Ry Ru . Ta a E E) 
donde 


a » | | 
Rz = TazrTauTao -.. TazlPar... ox Pan! ... 


35 En el cuadro 1 del estudio del Dr. Neyman, hay notable correlación. 
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considerado es el de estimar ciertas características de una población heterogénea, en 
base a una muestra limitada. Al hacerlo debemos considerar, si podemos, la mejor 
forma de tomar la muestra, cómo obtener nuestra estimación y qué medida de 
confiabilidad atribuir a esa estimación. Para contestar estas preguntas es necesario 
hacer ciertas suposiciones con respecto a la población desconocida y es importante 
emplear un método de muestreo y de estimación que reduzca a un mínimo estas 
suposiciones inevitables, estableciendo, al mismo tiempo, en forma perfectamente clara, 
sus implicaciones precisas. No creo que este problema pueda resolverse sino mediante 
la introducción de la matemática. Por supuesto, las matemáticas por sí solas no son 
adecuadas, pero creo que sólo se logra el nivel de pericia estadística más alto cuando, 
para planear una investigación, intentamos formular, en términos precisos y por tanto 
matemáticos, el sistema de hipótesis sobre el cual ha de estar basada nuestra inferencia 
final. Es hacia este nivel que el Dr. Neyman está orientando el camino. 

El problema especial del trabajo y de otras investigaciones de este tipo, ha sido 
el de estimar el valor promedio de algún carácter de la población. Esta es la forma 
del problema de muestreo que se les ha presentado a muchos investigadores. 

Sin embargo, antes de volver a sentarme desearía sugerir que hay muchos casos 
en los cuales se necesita un método de muestreo representativo: cuando el promedio 
no va a ser suficiente, cuando en realidad es necesario estimar de alguna forma la 
naturaleza y el grado de heterogeneidad de la población. Este no es, tal vez, un pro- 
blema fácil por cuanto tenemos que determinar primero cuál es la medida más apro- 
piada de la heterogeneidad en un caso particular. 

Permítaseme ilustrar esto considerando, en lugar de poblaciones humanas, una 
población de ladrillos en un horno. Debido a la ubicación del fuego, la calidad de los 
ladrillos varía muy considerablemente de una parte a otra del horno. Medimos varios 
caracteres de esos ladrillos, entre ellos, su resistencia; aunque ésta es de menor impor- 
tancia en sí misma, está correlacionada con importantes propiedades del desgaste debido 
a agentes atmosféricos. ¿Qué deseamos saber acerca del lote de ladrillos proveniente 
del horno? El promedio exacto de resistencia es de mucho menor importancia que la 
uniformidad y, en particular, que las resistencias inferiores que pueden encontrarse. 
Al determinar el procedimiento de muestreo a emplear, tenemos que decidir primero 
que índice o índices de uniformidad tendrán mayor valor para nosotros y luego decidir 
mediante qué reglas de muestreo y de cálculo pueden obtenerse las estimaciones más 
dignas de confianza de estos índices. 

Otro ejemplo es el de los fertilizantes que pueden venderse en bolsas, las cuales 
se llenan de un gran silo en el que se almacena el material, puede que haya falta de 
uniformidad en la calidad del material. Sobre esto, creo que los porcentajes de los 
elementos constituyentes de los fertilizantes estándares están establecidos por ley; por 
ejemplo, puede que el contenido de nitrógeno no deba ser menor que, por ejemplo, 
un 12 porciento. Por consiguiente, el productor desea estar seguro de que no se le 
reclamará porque se encuentre que la calidad de una bolsa está por debajo de ese 
nivel. Para él es importante tener una medida del contenido promedio de nitrógeno, 
pero también necesita disponer de algún esquema de muestreo que le dé una seguridad 
razonable de que no está despachando bolsas en las cuales el contenido es menor que 
una cierta cantidad y, también, de que no haya ninguna en la cual el mismo sea 
demasiado elevado. Debe encontrarse algún método representativo de prueba. 

Un ejemplo final es el del cemento. La prueba corriente consiste en tomar 
porciones de cemento de diferentes lugares de la masa, mezclarlos, cuartearlos y final- 
mente someter una pequeña muestra al análisis químico. El resultado dará una idea 
de la calidad promedio, pero nada más. No obstante, lo que es más importante para 
el usuario, por cuanto afecta su técnica de mezclado y fraguado del hormigón, es la 
uniformidad del material. Por lo tanto, nuevamente se desea algún método de muestreo 
representativo que suministre alguna idea sobre la uniformidad y no sólo sobre el 
promedio. 

Estos son problemas del futuro, pero creo que no de un futuro muy distante. 
Para resolverlos, deberá planearse un método de muestreo representativo basado en 
una estructura estadística sólida. Por supuesto, esto no significa, que se presentarán 
al fabricante o al Instituto Británico de Estándares (British Standards Institution) los 
planteos matemáticos, como tampoco fueron presentados por el Dr. Neyman al Ins- 
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tituto Polaco de Problemas Sociales, pero espero que ellos estarán debajo, como un 
cimiento. 

El DR. ISSERLIS dijo que con referencia a Sylvester, mientras él fue profesor 
de Geometría en la Universidad de Oxford, se contaba que cuando descubría algún 
resultado muy escondido, salía de sus habitaciones, vestido o no adecuadamente, abordaba 
al primer lechero o cartero que encontraba en la calle y no se desprendía hasta que 
su víctima confesaba que había sido convencido por Sylvester acerca de la verdad de 
la teoría que él había descubierto. El Dr. Neyman ha combinado en un sólo estudio, 
puntos de vista sobre los fundamentos filosóficos del método estadístico con una 
exposición sobre un importante problema técnico. Cada uno de ellos hubiera sido 
suficiente para un estudio, pero prefirió tratar ambos en uno. 

El Prof. Bowley experto en ambos problemas, que ha sido profesor durante una 
generación, tanto de la teoría como de la aplicación de la estadística, y que ha sido 
el principal expositor de este problema técnico, se refirió sólo en forma muy breve 
al segundo tema, que en realidad ocupó el primer lugar en el estudio. 

El Dr. Isserlis, creyó que era necesario que alguien enfrentara la tarea de trata 
de decir, sin usar las matemáticas, qué es lo que se encontró de desorientador en esta 
especie de filosofía y ver dónde se estaba. La Sociedad había recibido la experiencia 
[dijo el Dr. Isserlis], en este mismo salón, de personas que fueron más afortunadas 
que los matemáticos. Los economistas, hombres como Mr. Hawtrey, que estaban acos- 
tumbrados, en su vida científica, a desempeñarse con la taquigrafía de una técnica 
especial tal como la matemática, vinieron y hablaron a sus colegas, expertos en finanzas 
y en economía, sin usar el lenguaje técnico, y algunos de sus amigos quedaron estu- 
pefactos ante tal maestría, mientras sus colegas, entre ellos Sir Alfred Flux y el 
Sr. Macrosty sorbieron eso como leche. 


Expresó [el Dr. Isserlis] el deseo de referirse brevemente al asunto que lo estaba 
preocupando, y dijo que trataría de presentarlo en forma clara, sin recurrir a la mate- 
mática. Existe [expresó] una teoría clásica de probabilidades, basada en ciertas defini- 
ciones y experiencias, que indica la forma de medir y expresar la falta de convencimiento 
personal completo sobre ciertas materias. Existen dos cuestiones: ¿Podría uno conocer 
cuál es el estado de cosas en una población general y preguntarse qué es posible obtener 
en casos particulares? Por ejemplo, uno podría estar convencido de que los peniques 
suministrados por la Casa de la Moneda son bastante simétricos, y sobre la base de 
eso podría decir que la probabilidad teórica de tener cara es, digamos, de un 50 por 
ciento. Suponiendo que una moneda se arrojara 100 veces, podría entonces decirse, 
¿qué debería esperarse? Habría que sorprenderse si se presentaran solamente 30 caras 
o si ocurrieran 90, o debería esperarse obtener aproximadamente 50? Sin recurrir 
a ninguna técnica matemática, era quizás suficiente decir, en esa situación, que existía 
una probabilidad a priori de un medio? 

Pero existe el problema inverso. Se arroja una moneda 100 veces y cae presentando 
cara las 100 veces. ¿De qué clase de universo de monedas provino? ¿Ha provenido de 
una clase de universo de monedas en el cual el lado que corresponde a la cara tiene 
mayor probabilidad de presentarse hacia arriba, que el lado correspondiente a la cruz? 

La teoría clásica nos ha suministrado un método que, cuando está limitado en 
su aplicación al campo para el cual ha sido creado, es perfectamente válido. De acuerdo 
con esta teoría, si conociéramos la probabilidad a priori de que el penique fuera uno 
del tipo Epsom Downs o uno del tipo corriente fabricado por la Casa de la Moneda, 
igualmente probable de caer en cara o en cruz, o si supiéramos que se trata de un 
penique que tiene tres veces más posibilidad de caer mostrando cara que cruz—entonces, 
si se observaran 70 caras en 100 pruebas, podríamos decir cuáles son las respectivas 
probabilidades de que el penique fuera uno del tipo corriente o uno del tipo Epsom 
Downs. 

Las críticas que se han hecho a la llamada teoría de la probabilidad inversa y 
al teorema de Bernoulli han reposado siempre no sobre la exactitud de la teoría en 
sí misma, sino sobre la corrección en su aplicación porque, en la mayoría de los casos, 
estos aspectos no eran conocidos en absoluto, a priori. 

Dada la probabilidad real en el universo, es posible hacer afirmaciones, en términos 
de probabilidades, acerca de lo que sería posible obtener de una muestra. Estas afir- 
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maciones en términos de probabilidad suministran, generalmente, una medida de la 
probabilidad de que se cumpla cierta desigualdad. Con referencia a la ecuación (1) 
del apéndice 1 del trabajo del Dr. Neyman, en ella 7 era algo que pertenecía a la muestra 


observada y allí se suponía que conocíamos, momentáneamente, la propiedad particular 
del universo. 


Su propia crítica [del Dr. Isserlis] a esa ecuación en particular, y a la totalidad 
de la estructura formada sobre esa base, fue que ello no era nada nuevo; que no 
se apartaba de las diversas tentativas anteriormente realizadas. Lo que en realidad 
se hizo [según el Dr. Isserlis] fue esto: se eligió un determinado 6; se planteó una 
desigualdad y se eligieron más valores de 4. En cada una de estas desigualdades, € que 
se presentaba a la derecha de la ecuación, apareció a la izquierda en la definición de 
desigualdad y el Dr. Neyman la dejó fuera de la ecuación. Cuando se hubieran marcado 
todos los puntos provenientes de todas las desigualdades que podían obtenerse consi- 
derando todos los valores permisibles de 9, hallaríamos que mo estamos más allá que 
el hombre que dijo: “Supongamos que la probabilidad a priori del universo se distribuye 
en una forma particular. Supongamos que ella cumple con una cierta ley.” Algunos 
han tratado de evitar las dificultades diciendo: “Podemos obtener resultados generales, 
no mediante la suposición de que la probabilidad a priori satisface una cierta ley, 
sino suponiendo simplemente que ésta es continua,” lo cual significa que si la proba- 
bilidad de que un penique sea exactamente simétrico fuera tal y tal, la probabilidad 
de que el penique sea casi simétrico sería aproximadamente igual. En realidad, esa 
suposición es equivalente a la ausencia de vacios entre los puntos de las curvas presen- 
tadas por el Dr. Neyman; otros han tratado de llevar hasta el fin las consecuencias de 
suponer que la probabilidad a priori era continua en las proximidades de un punto 
determinado. Todos estos intentos anduvieron por las ramas, pues el problema se 
planteó incorrectamente. Cuando dijimos que si la probabilidad del universo fuera fp 
entonces la probabilidad de una cierta muestra sería x, estábamos especificando la 
probabilidad de una cierta desigualdad. Es una cuestión de álgebra elemental partir 
de ella y decir que la desigualdad así determinada, que establecía que X debe estar 
entre ciertos límites en términos de 4 y de e, conduce a otra desigualdad que indicaba 
que dado zx, 9 debe estar entre ciertos límites que también dependen de z y de e, y 
que existe una probabilidad para ella. La idea filosófica en el fondo de esto era un 
tanto complicada, porque no se estaba en ese momento hablando de una probabilidad, 
sino de la probabilidad de una probabilidad. Estábamos midiendo la probabilidad de 
la verdad de la afirmación de que una cierta desigualdad tuviera una determinada 
probabilidad. Hace cien años, los matemáticos trataron de sumar un número infinito 
de términos de una serie y hablaban acerca de la razón de dos cantidades, que en 
última instancia desaparecía. Ellos eran buenos matemáticos, que poseían una intuición 
muy clara y la mayoría de sus resultados fueron correctos y sobrevivieron en esencia. 
Nosotros tenemos conocimiento de que ocasionalmente ellos fueron arrastrados hacia 
una ciénaga y decimos “los matemáticos no pueden realizar un número infinito de 
operaciones, pero pueden formular afirmaciones precisas acerca de ciertas desigualdades,” 
es tiempo que la gente reconozca que si bien ciertas probabilidades no pueden evaluarse, 
se pueden formular, con provecho, afirmaciones correctas del tipo P(P*”). Es posible 
continuar hacia cosas más elevadas y hablar de probabilidades de tercer orden o de 
órdenes superiores, permaneciendo aún en la región del antiguo asunto. El principio 
a seguir es el que las entidades no deben multiplicarse más allá de lo necesario. Esto 
fue un argumento en contra de los cinturones de confianza, etc., si ellos en realidad 
sólo expresan probabilidades de afirmaciones de la misma clase que aquéllas que se 
habían formulado en el pasado. El Dr. Isserlis creyó que tal vez él había estado 
equivocado y que hubiera tenido que seguir la línea establecida por el Prof. Bowley, 
en lugar de atrincherarse en las matemáticas. Tal vez fue una tarea sin esperanzas 
el tratar y plantear matemáticas sin tiza o empleándola al mínimo. Pidió disculpas 
por si, en algún sentido, su exposición hubiera resultado incomprensible; estaría satis- 
fecho si hubiera surgido a la luz algo de lo que él había querido decir. 


El PROF, FISHER dijo que el problema del muestreo desempeñó un rol impor- 
tante en la investigación agrícola. Fue por cierto en la agricultura experimental donde 
se desarrolló, por primera vez, una técnica adecuada que puso de manifiesto los dife- 
rentes aspectos del problema del muestreo y mostró, de manera completamente exacta, 
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cómo estos diferentes aspectos se hallaban interrelacionados. En la lúcida descripción 
que el Dr. Neyman hizo de la técnica del muestreo aplicada a las investigaciones eco- 
nómicas, que tal vez haya estado influenciada por su experiencia personal en las Ciencias 
Agrícolas, uno de los rasgos que más le interesaron [al Prof. Fisher] fue el paralelismo 
entre los procesos que aquél [Dr. Neyman] defendió. (y las razones que dió para ellos) 
por un lado y los correspondientes procesos y razones que habían sido desarrollados 
por estudiosos en investigaciones agrícolas de este país [Inglaterra]. 


Su propio contacto con la materia se estableció en Rothamsted, donde tuvo el 
placer de colaborar con una sucesión de brillantes fisiólogos botánicos bajo cuya di- 
rección, y especialmente bajo la de los Dres. Maskell y Clapham, se perfeccionó gradual- 
mente la técnica. Como en el muestreo agrícola las consideraciones técnicas se encuen- 
tran en su expresión más sencilla, las conexiones lógicas entre los medios empleados 
y las inferencias que podían válidamente extraerse eran muy claras; podría por tanto 
resultar útil que él presentara un esquema de la jerarquía de cinco subdivisiones suce- 
sivas usadas en el muestreo de un experimento agrícola. Exactamente los mismos pro- 
blemas discutidos por el Dr. Neyman podrían ilustrarse muy simplemente de esta manera. 


La unidad más pequeña que es menester considerar, la unidad de medida como 
podría denominarse, consistió en el caso de un cultivo de cereal en tal vez, 10 pulgadas 
o 25 centímetros medidos a lo largo de un surco de arado. En otra ocasión, ella podría 
consistir en una sola planta, como en el caso de las papas o de las remolachas. Pon 
simplicidad, el seguirá refiriéndose al cultivo de cereales. Un número de unidades de 
muestreo, por lo general cuatro, seleccionadas en posiciones relacionadas entre sí, aunque 
no necesariamente adyacentes, constituyó una unidad de muestreo, que contenía, por 
tanto, en total un metro de surco que sin embargo en la práctica se tomó de cuatro 
surcos diferentes. Por el hecho de que las partes de una unidad de muestreo se fijaron 
en posiciones relacionadas entre si, las posiciones de todas ellas se determinaron en forma 
simultánea mediante una sola operación de muestreo aleatorio, es decir, mediante la 
elección, a través de un proceso físicamente aleatorio, de la unidad particular de muestreo 
utilizada, de entre todas aquéllas disponibles en el área de muestreo. Con este proce- 
dimiento, se obtuvieron dos o más unidades de muestreo de cada área de muestreo, 
localizándose cada una independientemente mediante una nueva operación de selección 
aleatoria. Era esencial que hubiera por lo menos dos unidades localizadas independien- 
temente en cada área de muestreo, ya que el error de muestreo debía estimarse en base 
a las diferencias entre estas áreas o en base a las varianzas entre las mismas, si había 
más de dos. La varianza entre las unidades de medida dentro de la misma unidad de 
muestreo, sirvió a un propósito diferente y subsidiario. Para el estudio era esencial 
la estructura o el tamaño que tuviera la unidad de muestreo, ya que analizando la 
varianza dentro y entre las unidades de muestreo uno podía asegurarse que las unidades 
fueron definidas en tal forma que dieran la máxima precisión, en retribución del 
trabajo invertido. Pero una vez que se hubiera definido su tamaño y estructura, este 
análisis no podría arrojar más luz sobre la interpretación de los resultados experimen- 
tales. Por otro lado, el error del muestreo aleatorio debería averiguarse con elevada 
precisión en cada experimento al que se aplicó el método de muestreo, puesto que en 
dicho error uno se basaría para juzgar el número de unidades de muestreo que podrían 
tomarse ventajosamente del cultivo. Un número habitual y conveniente fue de 32 para 
cada parcela experimental. Por lo tanto, la parcela constituiría va sea un área de 
muestreo individual que proporcionaría 32 unidades de muestreo, o tal vez estaría sub- 
dividida en cuartos conteniendo cada uno 8 unidades, o cuanto más en dieciseisavos, 
proporcionando cada uno dos unidades de muestreo. 


Antes de continuar con los miembros superiores de la jerarquía, puede resultar 
útil indicar un paralelo sociológico. La unidad de muestreo puede pensarse como siendo 
una familia (o una casa, o un distrito de registro). El área de muestreo puede pensarse 
como siendo un estrato de tales familias, cuando ellas son estratificadas, por ejemplo, 
con respecto a sus ingresos. La parcela podría pensarse como siendo todas las familias 
de un grupo ocupacional dado, en un área determinada, independientemente de sus 
ingresos. Entonces, la subdivisión de la parcela agrícola en áreas de muestreo jugaría 
el mismo rol, en el aumento de la precisión de las estimaciones finales, que la estra- 
tificación de un grupo ocupacional de acuerdo con sus ingresos. Sin embargo ellos 
estaban interesados, en último término, en comparar la parcela agrícola con otras par- 
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celas que habían recibido diferentes tratamientos agrícolas, en la misma forma en que 
podría tenerse interés en comparar la morbilidad de un grupo ocupacional con la de 
otros grupos ocupacionales. El muestreo no fue una parte esencial de esta comparación, 
sino solamente un medio conveniente de medida para el cual el principal interés con- 
sistía en que fuera suficientemente exacto. 


En un experimento agrícola diseñado para comparar, por ejemplo, 6 tratamientos 
diferentes, podrían asignarse al experimento 48 parcelas y después de dividir el área 
experimental en 8 bloques compactos, conteniendo cada uno 6 parcelas, estas 6 parcelas 
deberían asignarse, estrictamente al azar, a los 6 tratamientos experimentales. Este pro- 
ceso de aleatorización experimental no podría, desafortunadamente, imitarse en encuestas 
sociológicas. Si esto fuera posible, ciertamente se conocería más de lo que en la actua- 
lidad se sabe sobre causa y efecto en las actividades humanas. Pero dentro de esta 
limitación, el experimento es extrictamente paralelo a uno que involucre la comparación 
de 6 grupos ocupacionales, por ejemplo en 8 ciudades diferentes. Sin embargo, en un 
experimento bien diseñado, las matemáticas se simplificaron y se evitó toda ansiedad 
con respecto a los diferentes sistemas de ponderación. El Dr. Neyman defendió, sensa- 
tamente, según su opinión [de Fisher] el sistema que él atribuyó a Markoff, aunque ese 
era, en esencia, el sistema de Gauss. Debe recordarse que si las varianzas provenientes 
de las diferentes poblaciones no fueran a considerarse iguales, dentro de una expectativa 
razonable, difícilmente se tendría un conocimiento anterior o una evidencia experimental 
suficiente como para hacer de los P, de la ecuación (8) del Dr. Neyman, propiamente 
hablando, números conocidos. Esto le pareció al Prof. Fisher una verdadera dificultad 
si uno desea referirse al método como el mejor posible, mientras que no habría obstáculos 
si, como seres razonantes, los estadísticos se contentaran con que éste fuera un método 
bueno o válido. La subdivisión en bloques puso en claro el hecho de que el error de 
muestreo no era la única clase de error que debía considerarse. En último término, la 
validez de las ecuaciones debe depender de la concordancia de la evidencia proveniente 
de los diferentes bloques. 


Podría esperarse [agregó el Prof. Fisher] que él comentara aquellas aplicaciones de 
lógica inductiva que constituyeron un aspecto tan ilustrativo y refrescante del trabajo 
presentado esta noche. Todos reconocían que las inferencias provenientes de material 
de observación presentan, en el fondo, problemas de lógica matemática. También, todos 
tienen plena conciencia de que más de 150 años de discusión sobre los pros y los contras 
de la probabilidad inversa, sólo habían dejado el asunto aún más oscurecido por la 
duda y la frustración. No obstante, recientemente algunos investigadores que estaban 
trabajando en los reinos aparentemente abstractos de la teoría de la estimación y de 
las bases lógicas de las pruebas de significación, habían sentido crecer su confianza 
en el hecho de que pueden extraerse inferencias rigurosamente exactas, aunque por 
supuesto inciertas, siempre que se planteen adecuadamente, a partir de datos observables 
o experimentales. En una palabra, podía confirmarse la confianza de los defensores de 
la probabilidad inversa, en el sentido de que se podrían algunas veces extraer, con 
seguridad, conclusiones válidas del tipo buscado, al tiempo que podrían rechazarse, 
como innecesarias, las suposiciones arbitrarias sobre las cuales se habían apoyado tales 
inferencias, desde la época de Laplace en adelante. El aspecto particular de este trabajo, 
del cual el estudio del Dr. Neyman, fue una notable ilustración, ha sido la deducción 
de lo que el Prof. Fisher ha denominado probabilidad fiducial. El Dr. Neyman no 
empleó esta expresión, que él sugirió había sido mal interpretada, sino que usó en 
su lugar la expresión “coeficiente de confianza.” El Prof. Fisher expresó la creencia de 
que el Dr. Neyman debía estar equivocado al pensar que la expresión probabilidad 
fiducial había conducido a algún malentendido; personalmente él no había encontrado 
ningún indicio de ésto en la literatura. Cuando el Dr. Neyman dice “esto no puede 
realmente distinguirse del concepto corriente de probabilidad” el Prof. Fisher concuerda 
con él; y ésto le pareció una razón como para darle la denominación de probabilidad 
y no de coeficiente. La calificó desde el primer momento con la palabra fiducial, 
para mostrar que era ésta una probabilidad inferida mediante el método fiducial de 
razonamiento, entonces poco familiar, y no mediante el método clásico de probabilidad 
inversa. El Dr. Neyman calificó esto con la palabra confianza. El significado era 
evidentemente el mismo y él no deseaba negar que el vocablo confianza podía usarse 
en función de adjetivo. Todos estaban muy familiarizados con ésto, como lo había 
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recordado el Prof. Bowley, con la frase “artificio de confianza.'* No obstante, el vocablo 
fiducial sería tal vez, en un terreno puramente formal, el mejor adjetivo. 

El Dr. Neyman, como él lo explicó difirió con el Prof. Fisher en la importancia 
relativa que atribuyó a las dos etapas en las que él había intentado desarrollar una 
teoría de estimación, independiente de todas las suposiciones respecto a la probabilidad 
a priori, precisamente, el primer enfoque a través de las nociones de verosimilitud y 
cantidad de información, en comparación con el enfoque posterior de la noción de 
probabilidad fiducial. Esta diferencia no fue enteramente de perspectiva. Las propias 
aplicaciones del Prof. Fisher de la probabilidad fiducial, habían sido severa y delibera- 
damente limitadas. Ciertamente él había esperado, que el ingenio de escritores posterio- 
res encontraría los medios para extender su aplicación a casos acerca de los cuales él 
tenía todavía dudas, pero algunas limitaciones parecían esenciales. Aquellos que han 
seguido las primeras partes del desarrollo del asunto no tendrán dificultad en percibir 
esas limitaciones, pero habría peligro oculto para aquéllos interesados sólo en los últimos 
capítulos. En particular, él recurriría al argumento fiducial, o más bien proclamaría 
una validez única” para sus resultados, solamente en aquellos casos en los cuales se 
hubiera resuelto completamente el problema de la estimación, propiamente dicha, es 
decir, ya sea cuando existiera una estadística del tipo denominado suficiente, que 
contuviera en sí la totalidad de la información suministrada por los datos o sea cuando, 
aunque no existiera ninguna estadística suficiente, pudiera aún utilizarse la información 
total, como información auxiliar. Por fortuna estos dos casos ocurren habitualmente 
pero la limitación parece necesaria, si se quiere evitar extraer del mismo cuerpo de 
datos, afirmaciones de probabilidad fiducial que estuvieran en aparente contradicción. 

El Dr. Neyman pretendió haber generalizado el argumento de la probabilidad 
fiducial y tuvo toda la razón para enorgullecerse de la orientación del argumento por 
él desarrollado, por su perfecta claridad. La generalización fue amplia y muy atractiva, 
pero ha sido erigida con considerable gasto y tal vez hubiera sido también necesario 
considerar ese costo. El primer punto sobre el cual él [el Dr. Neyman] debió llamar 
la atención fue la pérdida de unicidad del resultado y el consiguiente peligro de 
inferencias aparentemente contradictorias. 

En segundo lugar, el Prof. Fisher ha limitado su aplicación a distribuciones con- 
tinuas esperando, con más confianza en este caso, que la limitación pudiera eliminarse 
posteriormente. El Dr. Neyman eliminó esta limitación, pero a costa de reemplazar 
las inferencias que presentaban el valor exacto de la probabilidad fiducial por desigual- 
dades que establecían que ella no era menor que algún valor asignado. Esto significó, 
en cierta medida, una amplia desviación, por cuanto suscitó la cuestión de si eran 
realmente imposibles las afirmaciones exactas sobre probabilidad y en caso de serlo, 
si la desigualdad a que se había llegado era realmente la desigualdad más cercana que 
pudiera derivarse mediante un argumento válido, a partir de los datos. 

En tercer lugar, el Dr. Neyman propuso extender el argumento fiducial, desde 
los casos en los que había un solo parámetro desconocido, a casos en los cuales había 
varios. Aquí, nuevamente, podrían existir serias dificultades con respecto a la consisten- 
cia mutua de las diferentes inferencias a ser extraídas, por cuanto, con un solo pará- 
metro, podría mostrarse que todas las inferencias pueden ser resumidas en una sola 
distribución de probabilidad para ese parámetro y que, por esta razón, todas serían 
mutuamente consistentes; pero todavía no se había mostrado que cuando los parámetros 
son más de uno, podía establecerse alguna distribución de frecuencias semejante. 

El Prof. Fisher dijo que él debía señalar aquí que el Dr. Neyman le hizo mucho 
honor al atribuirle el establecimiento de la distribución de “Student.” Fue el mismo 
“Student” quien efectuó el novedoso paso que en realidad había revolucionado la teoría 
de los errores. El [Student] mostró, en el caso particular que trató, que era posible 
hallar una cantidad que les era conocida como la “t de Student,” la cual tuviera una 


36 Naturalmente, las afirmaciones no rigurosamente demostrables como son éstas, pueden no 
ser verdaderas. Sin embargo, pueden sólo transmitir la verdad a aquellos que captan su significado 
exacto; en el caso de las afirmaciones fiduciales basadas en estimaciones ineficientes, este significado 
debe incluir la especificación del proceso de estimación empleado. Pero se sabe que este proceso 
omite o suprime parte de la información suministrada por la muestra. Las afirmaciones basadas en 
estimaciones ineficientes son por consiguiente ciertas, en tanto se entienda aue las mismas no 
constituyen la verdad total. Las afirmaciones basadas en estimaciones suficientes están libres de este 
inconveniente y pueden reclamar una validez única. 
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distribución de frecuencias independiente de todos los parámetros desconocidos y que, 
al mismo tiempo, fuera expresable como función de uno solo de estos parámetros, junto 
con otras cantidades directamente observables y por lo tanto conocidas con exactitud. 
Esto, como le pareció al Prof. Fisher, constituyó la verdadera revolución. Todo lo que 
él agregó fue “studentizar”” [llevar a la forma de Student] una cantidad de problemas 
análogos y explotar las ventajas lógicas de la posición hacia la cual él mostró el camino. 
Fue tanto más esencial que él pusiera esto en claro, por cuanto “Student'” era un 
hombre demasiado modesto para reclamar, y aún quizás para creer, cuánto había hecho 
él por el progreso de la teoría estadística. 

La crítica referente a la consistencia mutua de las posibles diferentes inferencias, 
no afectan el valor del consejo del Dr. Neyman acerca del problema del muestreo. 
Solamente lo destacó aquí, porque había sido precisamente este asunto de la consistencia 
el que había conducido a una serie de autores matemáticos a rechazar la teoría de 
la probabilidad inversa, y él no deseaba ver que la probabilidad fiducial siguiera el 
mismo camino. 

Después de la reunión, se recibió la siguiente contribución de parte del PROF. 
OSKAR ANDERSON: El Dr. Neyman se ha referido a la encuesta sobre las condiciones 
de la agricultura en Bulgaria. Como soy responsable del método científico aplicado 
en dicha encuesta y de las orientaciones principales seguidas en su organización (la 
ejecución técnica estuvo a cargo del Dr. Stefanoff, y por supuesto, del Director de la 
Oficina de Estadística de Bulgaria, Dr. Kiranoff), desearía que se me permitiera hacer 
algunas observaciones. 

El proceso de seleccionar los pueblos a ser investigados fue, por cierto, difícil 
en el caso de la encuesta de Bulgaria, y llevó un tiempo relativamente largo. Nuestra 
opinión fue que, para nuestro tipo de selección, éste es el problema central y la clave 
de todo el trabajo. Comenzamos eligiendo todos los pueblos en los cuales se había 
desarrollado primordialmente alguna forma de actividad agraria (tal como cultivo de 
tabaco, rosas, arroz, gusanos de seda, viñas, etc.). Estos formaron 13 grupos que contenían 
aproximadamente 1.000 pueblos. Los restantes 4.000 pueblos de Bulgaria que formaban 
una masa mucho más homogénea, se dividieron en 5 regiones climáticas, y cada una 
de éstas, a su vez, en 3 regiones físicas—pueblos en las laderas de las montañas, pueblos 
en las faldas y pueblos de llanura. Se controló la uniformidad de la composición de 
cada grupo. Luego elegimos para nuestra muestra algunos pueblos de cada grupo, 
en forma tal que contuvieran aproximadamente un cincuentavo de las fincas del grupo, 
y que, a su vez, dieran para los datos del Censo de 1927, la misma distribución del 
tamaño de las propiedades (en 15 categorías) que la del grupo total del cual ellas 
fueron tomadas. Luego se controló cuidadosamente esta elección preliminar, comparando 
las medias de las características de la muestra con las medias para el total de Bulgaria, 
para todos los datos suministrados por el censo de 1927. Después de algunas correcciones 
en la primera elección, se encontró que por lo menos en 18 direcciones de cada 19, 
la concordancia resultaba muy satisfactoria.* Esto está confirmado por 19 cuadros y 
diagramas publicados en el Bulletin de Statistique de Bulgaria, número 8, 1934, una 
copia del cual está ahora en la biblioteca de esta sociedad. También tratamos de 
arribar a una distribución más o menos uniforme de los pueblos seleccionados, sobre 
el territorio de Bulgaria. 

El Dr. Neyman encuentra que hay sólo un detalle en nuestra encuesta, acerca 
del cual él no tiene la seguridad de que esté justificado: a saber, la forma dirigida de 
seleccionar los pueblos en los 28 “estratos” anteriores, en lugar de usar el muestreo 
puramente aleatorio. El piensa que “la variabilidad de las fincas y pueblos es también 
un carácter de su población, que puede ser de interés.” Sin embargo este carácter 
estaría sesgado en la muestra. 


Mi respuesta es: 


(1) Nuestro objeto principal fue el de determinar gran cantidad de medias gene- 


rales para Bulgaria en su totalidad (en 1934) y no el de medir la variabilidad de ninguna 
característica, y 


37 La única excepción es el área de praderas artificiales—cantidad enteramente despreciable 


en Bulgaria. Algunas ligeras discrepancias en el área de viñedos, pueden explicarse fácilmente 
por la existencia de viñedos en las áreas urbanas (Varna, Plevna, etc.). 
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(2) Puede mostrarse que, debido: (a) a la pequeñisima escala de 
en Bulgaria; (b) a la uniformidad de cada uno de los 28 grupos; (c) al número rela 
tivamente grande de pueblos en la selección (100); y (d) al carácter aproximadamente 
lineal de la correlación entre el tamaño de las fincas y la mavoría de las otras 
características—la variabilidad de las fincas no estaría sensiblemente sesgada en una 
muestra que contuviera en cualquier caso más de 18.000 fincas; y en cuanto a la 
variabilidad de los pueblos, ésta ya es para nosotros bien conocida. 


la agricultura 


Sin entrar al aspecto matemático, consideremos el simple ejemplo siguiente. Sea 
nuestro problema el de determinar la longitud promedio del brazo derecho de los 
asistentes a la Reunión Anual de la Sociedad. Dejando de lado la estratificación porque 
complica innecesariamente nuestro ejemplo, el método de selección aleatoria con 
sistiría en una selección al azar de, por ejemplo, 10 miembros de la audiencia, para 
medir sus brazos derechos y calcular la media. Pero supongamos que sabemos de antemano 
que el promedio de longitud del brazo izquierdo. para todo el grupo presente, es 
digamos, de 28 pulgadas: si entonces seleccionamos nuevamente 10 miembros de la 
audiencia cuyo brazo izquierdo tenga esta o aproximadamente dicha longitud, entonces 
el Dr. Neyman estará de acuerdo en que es mucho más probable aue la nueva longitud 
promedio de los brazos derechos (estimada mediante una “selección dirigida'”) será 
más exacta que la primera media (estimada en base a una muestra puramente aleatoria) 
Pero si nuestra selección estuviera basada, por ejemplo, en el color promedio de las 
corbatas usadas por los miembros de la audiencia, el resultado sería mucho menos útil 
En la Encuesta de Bulgaria, creo que la analogía estuvo más próxima al control por 
la longitud del brazo izquierdo, que al control por el color de las corbatas 

¿Por qué usamos selección dirigida y no muestreo aleatorio, que es el que perso 
nalmente yo también prefiero? La razón es muy simple—tiempo y dinero. Siendo nuestro 
programa muy detallado, breve el tiempo y limitado el personal calificado disponible 
en Bulgaria, no era, de forma alguna, posible extender la encuesta a más de 100 pueblos 
El trabajo debía finalizarse en un mes, antes de la iniciación de las operaciones agrarias 
y, por supuesto, no podríamos enviar nuestro personal, relativamente reducido, a través 
de montañas, bosques, agua y nieve, al comienzo de la primavera y por los caminos 
de Bulgaria, a los, digamos, 1.000 pueblos, que se hubieran necesitado en el caso de 
un muestreo puramente aleatorio de los mismos aunque hubiera sido estratificado 

La Oficina de Estadística de Bulgaria espera publicar los resultados de nuestra 
encuesta a fines de este año. El informe contendrá una introducción teórica y todos 
los controles posibles, según Jos lineamientos generales indicados por las fórmulas del 
Prof. Bowley y también del Dr. Neyman. 


Para concluir: Estoy completamente de acuerdo con el Dr. Neyman en que con 
el muestreo aleatorio, el estadístico está en un terreno más firme y siente más confianza 
que con la selección dirigida. Pero difiero con él, pensando que existen ocasiones en 
que el último es más económico y exacto. Las condiciones para una buena selección 
dirigida son, en primer lugar, que el objeto de la encuesta posea algunas cualidades 
similares a las del ejemplo Búlgaro o Danés* y en segundo término, que todas las 
circunstancias de la encuesta deben ser muy cuidadosamente planeadas y controladas 
Estoy de acuerdo en que ambas condiciones están muy lejos de ser siempre posibles; 
y en cualquier caso opino que lo primero que se necesita para un resultado exitoso 
no es, de ninguna forma, “buena suerte,” como dice el Dr. Nevman, sino un perfecto 
conocimiento del objetivo y un sólido razonamiento estadístico. 

Contestación del Dr. NEYMAN: Estoy muy agradecido a todos aquéllos que 
han tomado parte en la discusión de mi trabajo. La discusión amplia es muy útil no 
sólo para los oyentes y lectores, sino también para el autor, porque le muestra qué 
es lo aue ha hecho correctamente en su trabajo y dónde ha errado 

Pienso que la presente discusión ha mostrado: (1) que mi crítica contra el método 
de selección dirigida fue suficientemente convincente y (ii) que las secciones concer 
nientes a los intervalos de confianza y al problema de estimación. no lo fueron. Entre 
los cuatro eminentes estadísticos cue honraron mi trabajo discutiéndolo, hubo solamente 


uno que defendió el método de selección dirigida. Y aun en ese caso, no fue una 


8 Ver Adolph Jensen, “Purposive Selection J 
págs. 541-547 


Vol. XCI 
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defensa al método en sí mismo, sino más bien a una encuesta en particular, en la cual 
se usó una mezcla del método de muestreo estratificado por grupos y del de selección 
dirigida. El Prof. Bowley afirmó que desconfiaba del método de selección dirigida, 
va en 1925, cuando preparó su informe para el Instituto Internacional de Estadística. 

Por consigu.ente, en lo que concierne al asunto principal de mi trabajo, sólo tengo 
que disentir con el Prof, Anderson y me complace que esa discusión se refiera únicamente 
a detalles y no a mi tesis principal. En realidad, su afirmación de que “con el muestreo 
aleatorio, el estadístico está en un terreno más firme y siente más confianza que con 
la selección dirigida,” muestra que estamos perfectamente de acuerdo en el punto 
principal. Nuestra concordancia se extiende aún más allá de lo que parece pensar el 
Prof. Anderson, por cuanto estoy de acuerdo con él en que, en ciertos casos, el método 
de selección dirigida puede aplicarse con gran éxito. Hasta llegué a sugerir una clase 
de problemas para los cuales éste es el caso (ver el último párrafo del texto principal 
del trabajo, pág. 618). Pero estamos confiando en la buena suerte, si aplicamos el 
método sin una evidencia suficiente de su validez. 

Es un hecho muy interesante que, en las condiciones de Bulgaria, las regresiones 
de muchos caracteres de las fincas, sobre su tamaño, sean lineales. En Polonia hemos 
encontrado * que muchas regresiones, por ejemplo la regresión del ingreso bruio sobre 
el tamaño y sobre los gastos, no puede representarse mediante un plano y que la regre 
sión parcial del ingreso sobre los gastos depende muchísimo del tamaño de las fincas. 
Probablemente, las condiciones 2grarias generales en los dos países son muy diferentes. 
La aplicación del método del Prof. Anderson en Polonia conduciría a estimaciones 
sesgadas de las medias buscadas. 

Con respecto al problema de determinar la longitud promedio del brazo derecho 
de los asistentes a la reunión, que ha sido citado por el Prof. Anderson como un caso 
en el que debería aplicarse el mótodo de selección dirigida, desearía hacer notar que 
éste es un caso especial de la clase de problemas indicados en la última frase de mi 
trabajo (pág. 618) como adecuados para la aplicación de este método. Por consiguiente, 
aquí estamos nuevamente de acuerdo. Sin embargo, no puedo concordar en aue la exacti- 
tud de una estimación insesgada aumentará si seleccionamos en forma dirigida, a los indi- 
viduos cuyo brazo izquierdo tenga aproximadamente la misma longitud que su promedio. 
La solwción de esta cuestión se obtiene directamente a partir de las fórmulas, ya 
ampliamente tratadas en los libros de texto,“ con el resultado que se obtiene mayor 


39 Ver: (1) W. Pytkowski: The Dependence of the Income in small Farms upon their Area, 
the Outlay and the Capital invested in Cows. Bibljoteka Pulawska, Varsovia, 1932 


(2) K. Iwaszkiewicz: La rentabilité de Vétendue, du fonds de roulement et du capital 
investi en vaches dans les petites exploitations rurales. Kwartalnik Statystyczny, t. IX, Fascicule 1, 
1932, Varsovia. 

(3) M. Iwaszkiewicz: Recherches statistiques sur la rentabilité des engrais artificiels dans 
les petites exploitations rurales. Kwartalnik Statystyczny, t. X, Fascicule 2-3, 1933, Varsovia. 

Todas estas publicaciones se encontrarán en “Statistica”—las colecciones de los trabajos prepa- 
rados en el Laboratorio Biométrico, en el Instituto Nencki y en el Laboratorio de Estadística del 
Colegio Central de Agricultura de Varsovia. 


4% Ver por ejemplo (1) M. Ezekiel: Methods of Correlation Analysis, New York, 1930, 
págs. 252-255. (2 R.A. Fisher: Statistical Methods for Research Workers, Londres, 1932, 
págs. 115-117. 

Por último, puede obtenerse la solución mediante un ajuste adecuado de las fórmulas (36), 
(37) y (39) de la nota 111 del apéndice, pág. 632. 

Las fórmulas mencionadas son Y = y + 


donde Te y representan las medias de la muestra de las dos variables, 02, y 0?,y las varianzas de 
la muestra, X la media conocida de r en la población, y” la estimación de la media de y en la 
población, pu? la estimación de la varianza de la misma, a el coeficiente de regresión de y sobre zx 
para la muestra. y r el coeficiente de correlación para la muestra. Como la diferencia |X — 7! 
prácticamente nunca es cero, a fin de lograr la mayor exactitud para la estimación de y', es 
aconsejable tratar de minimizar |X — 7| mantenierdo d+ tan grande como sea posible. Para hacer 
esto, es necesario incluir en la muestra individuos tanto con valores muy grandes, como con valores 
muy pequeños de 7. Entonces, la diferencia |X—Z| será pequeña y Oz grande, en tanto que y? 
se acercará a su valor mínimo 





Dos AspPecros DIFERENTES DEL MÉropo REPRESENTATIVO 649 


exactitud: (i) minimizando la diferencia entre las medias del control 
y para la población, y (ii) minimizando la desviación estándar del 
muestra. 


para la muestra 
control, para la 
No esperaba que las secciones de mi trabajo, concernientes con la nueva forma 
del problema de estimación, jugaran un papel tan grande en la discusión. Por lo menos 
es reconfortante que la crítica haya sido tan divergente como para que uno de los 
oradores pudiera decir que todo es dudoso, y otro, que nada es nuevo. 


Consideré nece- 
sario incluir estas secciones en mi trabajo, 


pues de otra forma el mismo no hubiera 
sido completo y estaría justificado preguntar por qué no me pongo en la tarea de 
considerar los problemas que el Prof. Bowley denominó problemas inversos. 


Requeriría demasiado espacio hacer comentarios detallados sobre todas las cuestiones 
surgidas en la discusión sobre los intervalos de confianza. En realidad, es necesario 
hacer una publicación separada para aclarar completamente el asunto. Como ella está 


en preparación, me limitaré a hacer sólo una o dos observaciones, que tal vez aclaren 
ciertos evidentes malentendidos. 


Se sugirió, en la discusión, que usé la expresión “coeficiente de confianza” en lugar 
de la expresión “probabilidad fiducial.” Esto es ciertamente un malentendido. La 
expresión coeficiente de confianza no es sinónima del término probabilidad. El repre- 
senta un valor, elegido arbitrariamente, de la probabilidad de que estemos en lo correcto 
cuando aplicamos una cierta regla de comportamiento. La relación entre el concepto 
de coeficiente de confianza y el de probabilidad, puede compararse a la relación entre 
los conceptos de “precio” y de “dinero” (esto si aceptamos la definición del 
como “una cierta cantidad de dinero que ha sido fijada por el vendedor ...?”). 


una comparación aún mejor sea la proporcionada por los términos 
y “dinero.” Aquí, 


“precio,” 
Cal vez 
“tasa de interés” 
la analogía es menos superficial de lo que podría esperarse. Los 
bancos están trabajando a una cierta tasa de interés, que se fija en un momento dado 
para un período más prolongado, y precisamente esta constancia condujo a la intro- 
ducción de la expresión “tasa de interés.” En la nueva forma del problema de la 
estimación, que ha sido discutido aquí de manera tan extensa, la validez de las afirma- 
ciones, en términos de probabilidad, depende del uso permanente de un sistema de 
intervalos de confianza. Este sistema como un todo (no los intervalos separados) 
corresponde a una probabilidad fijada de que nuestras predicciones sean correctas y 
existe ciertamente una ventaja definida en contar con una expresión especial para 
denominar a este valor de la probabilidad. Ello nos permitiría, por ejemplo, usar 
expresiones cómodas como las que siguen: la estación experimental de semillas en X, 
está trabajando con el coeficiente de confianza de 0,95, etc. 
Otro malentendido importante, que creo útil aclarar ahora, está contenido en las 
siguientes observaciones del Prof. Bowley concernientes a la 


teoría de los intervalos 
de confianza: 


“ (a) Nos conduce ésto realmente hacia lo que necesitamos—la probabilidad 
de que, en el universo aue estamos muestreando, la proporción esté dentro de estos 
determinados límites? Creo que no; (b) creo que estamos en condición de saber sea 
que ha ocurrido un suceso improbable o que la proporción en la población está dentro 
de los límites. ”” 

He marcado las dos frases con las letras (a) y 


(b), por cuanto tendré que comen- 
tarlas por separado. 


La frase (a) contiene el enunciado del problema de la estimación en la forma 
de. Bayes. El álgebra simple muestra aue la solución de este problema debe depender 
de la ley de probabilidad a priori. 


Por consiguiente, si todo lo que necesitamos consiste 
en 


“la posibilidad de que, en el universo que estamos muestreando, la proporción esté 
dentro de ciertos límites,'” no podemos, por cierto, ir más allá de lo ya conocido. 


Siempre que nos mantengamos en la vieja forma del problema, cualquier progreso 
ulterior es imposible. Sólo sería posible, si los autores que escribieron anteriormente 
sobre el asunto hubieran estado equivocados. El presente adelanto está relacionado con 
el hecho de aque, en lugar del problema matemático planteado en la frase (a), estamos 
resolviendo algún otro problema matemático, digamos («) el que: /i) tiene una solución 
independiente de cualesquiera suposiciones arbitrarias concernientes a la ley de pro- 
babilidad a priori y (ii) puede constituir una base para el trabajo práctico de un 
estadístico interesado en problemas de estimación. 
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Ahora bien, ¿cuál es la diferencia entre los problemas (a) y (a)? Ambos tienen 
que ver con probabilidades, pero estas probabilidades se aplican a diferentes eventos. 
En el problema (a) preguntamos acerca de la probabilidad de que un carácter de la 
población muestreada, caiga dentro de ciertos límites, mientras que en el problema (a) 
estamos interesados en la probabilidad de cometer un error cuando se aplica, constan- 
temente, una cierta regla de comportamiento. La primera probabilidad demostró ser 
dependiente de las probabilidades a priori. Por el otro lado, ha sido posible crear ciertos 
sistemas de afirmaciones acerca de los valores de los caracteres de la población, en 
forma tal que la probabilidad de estar equivocado en estas afirmaciones sea fija, cuales 
quiera sean las probabilidades a priori (la ley de las cuales puede o no ser continua, 
sin restricciones). Es muy importante que esta circunstancia de que, en el problema 
de los intervalos de confianza, las afirmaciones probabilísticas se refieran a los resultados 
de nuestro comportamiento, y no a las poblaciones, y de que dichas afirmaciones están 
relacionadas con esta regla determinada de comportamiento y no con las propiedades 
de las muestras a las cuales se está aplicando esta regla. 


A continuación, permítaseme hacer una observación sobre la frase (b) de la 
crítica del Prof. Bowley. Simplificaré la posición, suponiendo que deseamos determinar 
la proporción fp de bolas negras en una bolsa y para este propósito intentamos extraer 
n = 3 bolas (con reposición—para mayor simplicidad). El número de bolas negras 
en la muestra se indicará con X, la que puede tomar los valores 0, 1, 2, 3. En la frase 
(b) del Prof. Bowley se supone que hemos extraído realmente la muestra y que es, 
por ejemplo, X —= 3. Habiendo llegado hasta aquí, ciertamente no podemos decir 
mucho acerca de la probabilidad de que fp tenga algún valor definido. En realidad, 
todo lo que podemos decir es que ocurrió un hecho improbable o bien que fp tiene 
un valor bastante grande. Pero lo aue se hace en el método de intervalos de confianza 
es distinto. Comenzamos nuestro razonamiento como si lo hiciéramos antes de extraer 
la muestra. O en otra forma, suponemos que no es ésta la única muestra con la cual 
tendremos que trabajar. Notamos que la muestra nos puede suministrar solamente 
una de las cuatro posibilidades: X, =— 0, Xy = 1, Xy = 2, X, = 3. Habiendo notado 


esto, fijamos una regla de la manera siguiente: 


Si en la muestra que extraigamos es 


O entonces tendremos que establecer que 


Nos damos cuenta de que la afirmación que haremos al aplicar esta regla al 
resultado del muestreo real, puede estar errada o ser cierta. Calculamos la probabili 
dad P de que la afirmación sea cierta y tratamos de ordenar el sistema de valores 
de las r en tal forma de tener P<0,95 cualquiera sea la ley de probabilidad a priori. 


nada más acerca del valor de fp, de lo que el Prof. Bowley ha afirmado. Por otra parte, 
al hacer las afirmaciones siguiendo las reglas enunciadas anteriormente, sabemos algo 
importante acerca de los resultados de estas afirmaciones: la probabilidad de que 
estemos equivocados es entonces < 0.05, 


En esta forma, teniendo una muestra y sabiendo que X — 3, no podemos decir 


El último malentendido que desearía aclarar, se refiere al reconocimiento de los 
méritos del trabajo de “Student.” Ciertamente lo reconozco y lo aprecio mucho. Si 
llamo a una distribución con el nombre de “Student,” ello significa claramente que 
atribuyo su descubrimiento a “Student” y no a otra persona. Esto no me impide reco 
nocer y apreciar el trabajo del Prof. Fisher concerniente a la misma distribución. 

Estoy muy agradecido a todos los presentes a la reunión, por la amable recepción 
que han dado a mi trabajo 





Dos Aspecros DIFERENTES DEL MÉTODO REPRESENTATIVO 651 


Reconocimiento de prioridad. * El Profesor J. Neyman de la Universidad de 
California, escribe: Agradezco mucho al Dr. Donovan J. Thompson del Laboratorio de 
Estadística, Universidad del Estado de lowa, Ames, lowa, por llamar mi atención sobre 
el artículo de A. A. Tschuprow, “On the mathematical expectation of the moments 
of frequency distributions in the case of correlated observations” publicado en Metron, 
Vol. 2, No. 4 (1923), pp. 646-683, auc contiene algunos resultados reencontrados por mí 
y publicados en 1933, sin hacer referencia a Tschuprow 


Los resultados en cuestión son la fórmula general para la varianza del estimador 
de una media en el muestreo estratificado y la fórmula determinante de la estratificación 
óptima de la muestra. Estas fórmulas aparecieron primero en un folleto polaco An 
Outline of the Theory and Practice of Representative Method, Applied in Social 
Research publicado en 1933 por el Instituto de Problemas Sociales de Varsovia. Más 
tarde fueron publicados en inglés en el Journal of the Royal Statistical Society, Vol. 97 
(1934), pp. 558-625. Finalmente, las mismas fórmulas, de nuevo sin referencia al 
Profesor Tschuprow, fueron dadas en la segunda edición de mi libro, Lectures and 
Conferences on Mathematical Statistics and Probability, Washington, D.C., 1952 


El objeto de esta nota es, entonces, reconocer la prioridad del Profesor Pschuprow 
expresar mi pesar por haber desconocido sus resultados v agradecer al Di Thompson 
por haber llamado mi atención sobre la inadvertencia 


Reconocimiento publicado en el Journal of the Royal Statistical Society, Series A 


(General) 
CXV, Part IV, 1952. p. 602 





MAJOR DEVELOPMENTS IN THE THEORY AND 
APPLICATION OF SAMPLING DURING THE LAST 
TWENTY-FIVE YEARS 


P.V. SUKHATME, India * 


RESUMEN 


El Dr. Sukhatme destaca. en este artículo, los desarrollos 
principales de la teoría de investigaciones por muestreo desde 
la publicación, en 1934, del bien conocido trabajo del Profesor 
Neyman, en el cual critica el método de selección dirigida, 
llamando la atención sobre el método de selección aleatoria como 
el único que proporciona una base sólida para la inferencia 
estadística y presentando la teoría de la distribución óptima 
en el muestreo aleatorio estratificado. El artículo de Neyman 
estimula para trabajar en diferentes aspectos del muestreo 
aleatorio e induce a la búsqueda de sistemas de muestreo más 
eficientes. Estos incluyen a los muevos métodos de selección 
con probabilidad variable, con o sin reemplazo, y el desarrollo 
de los métodos de estimación de razón, de regresión y otros 
varios, haciendo uso de información complementaria obtenida 
de censos o investigaciones previas, o de la técnica del muestreo 
doble. Con el desarrollo reciente de la teoría y el tratamiento 
de los errores no de muestreo, se dió al problema de la eficiencia 
claro significado. Por tanto, en el moderno planeamiento de 
investigaciones por muestreo, los recursos disponibles se destinan, 
necesariamente, a la reducción de ambos tipos de errores. Los 
errores del muestreo aleatorio pueden ser controlados seleccio- 
nando el sistema de muestreo apropiado. Los errores no de 
muestreo pueden ser minimizados por el diseño apropiado del 
cuestionario, el buen entrenamiento del personal, la adecuada 
supervisión sobre todas las operaciones de la investigación, y pot 
el empleo de métodos objetivos de enumeración. 

La aplicación del muestreo fue paralela al desarrollo de 
la teoría. Muchos de los desarrollos teóricos fueron, por neceési- 
dad, aplicados para justificar la teoría con evidencias empíricas, 
y muchos otros fueron sugeridos por problemas hallados en las 
aplicaciones prácticas. La publicación de estos desarrollos, teó- 
ricos y aplicados, en revistas estadísticas, complementados por 
discusiones realizadas en reuniones y conferencias, proporcio- 
naron los medios de comunicación entre estadísticos de diferentes 
partes del mundo. El resultado fue la creciente confianza en 
el uso del muestreo moderno. Durante la última década, el 
muestreo recibió aceptación mundial debido, especialmente, al 
trabajo de promoción de los Estados Unidos y de sus agencias 
especializadas. El Instituto Interamericano de Estadística ha sido 
particularmente activo en América Latina. En el campo de 
las estadísticas agrícolas la Organización de las Naciones Unidas 
para la Agricultura y la Alimentación (FAO) ha asignado gran 


* Director, Statistics Division, Food and Agriculture Organization of the United Nations, 
Rome, Ttaly. This article was prepared in December 1959 


Y , 
The author wishes to thank his colleagues Messrs. El Mahdy Said and $5. Zarkovic whose 
help made it possible to prepare this paper in time for publication 
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importancia al rol que el muestreo puede jugar para mejorar 
la cobertura, exactitud y oportunidad de las estadísticas nacio 
nales y de su comparabilidad internacional. Este trabajo describe 
brevemente el programa de FAO para promover el empleo del 
método de muestreo en las estadísticas corrientes como también 
en los censos de agricultura, 

Se puede decir, verdaderamente, que la investigación y las 
contribuciones del Profesor Neyman representan el fundamento 


de la teoría y práctica de los métodos de muestreo tal cual 
los conocemos hoy. 


INTRODUCTION 


Several articles have appeared in recent years giving the historical 
development of the theory of sampling and its applications (Yates, 1946; 
Cochran, 1947; Stephan, 1947; You Poh Seng, 1951 and Zarkovic, 1956) 
It is not the intention in this article to give a systematic historical review 
of the literature on sample surveys; the aim is rather to point out only 
the major developments in sampling theory and its applications since 
the publication of Professor Neyman's paper of 1934, “On the “Iwo Dil. 
ferent Aspects of the Representative Method: “The Method of Stratified 
Sampling and the Method of Purposive Selection”. published in the Journal 
of the Royal Statistical Society, London. 

Systematic interest in the use of sampling methods appeared towards 
the end of the last century when Kiaer used the “representative method” 
for collecting data independently of the census. Sampling then had 
somewhat different meaning from today. In line with the present thinking, 
the representative method used by Kiaer and others dealt with a part 
of the population and had as its aim drawing the inference from the 
sample that would be valid for the populations. The primary difference in 
the earlier uses of the sampling method lay in the selections of the sample; 
it was thought that a purposive selection based on the sampler's knowledge 
of the population with regard to closely correlated characters was the 
best way of getting a sample that could be considered representative of 
the population. This type of selection dominated the earlier history of 
sampling methods, although clear traces can be found of early discussions 
of the merits of a random selection which was used for survey purposes by 
Tschuprow as early as the First World War (Romanovsky, 1946) and 
by many others immediately thereafter (Hubback, 1926; Gini and Galvani, 
1929; Clapham, 1930; Anderson, 1949; etc.). Professor Neyman's 1934 
paper was in this respect the final link in a relatively long chain of 
developments, practices and experiences. Once for all his paper made 
clear that random selection, unlike purposive selection, has in its basis 
a sound scientific theory which definitely gave to sample surveys the 
character of an objective research tool and made it possible to predict 
the validity of the survey estimates. Purposive selection nevertheless 
remained in use mainly because of its appeal as a cheap method, partic- 
ularly in the form of the quota method as practiced by public opinion 
survey organizations, although it has been crystal-clear that there is no 
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theory which would permit determining reliability of estimates bascd 
thereon. 

What is more important is that Neyman's 1934 paper opened up 
numerous new avenues for fruitful research in the theory and philosophy 
of sample surveys, and in this sense can be said to mark the beginning 
ol a new era altogether. The observations contained in this paper on 
such basic problems of surveys as the choice of sampling units, methods 
of estimation and the use of supplementary information provide the 
illustrations of this new approach. In earlier practices, units used for 
survey purposes were large clusters such as communes or villages. To 
illustrate the consequences of the use of large clusters, Neyman discussed 
the case presented by Gini and Galvani (1929). In order to get sample 
estimates of a census Gini and Galvani selected at random a sample of 29 
counties out of 214 and found that the estimates obtained were not 
representative. With the clear knowledge of the relationships involved, 
Neyman explaimed that 10 percent of the elementary units grouped in 
a larger number of smaller clusters would lead to highly reliable estimates. 
In subsequent developments this idea has become the basis of a considerable 
body of research on the efficiency of sample surveys. Likewise, Neyman 
pointed out that the use of the supplementary information (in this case 
for purposes of stratification) and the use of appropriate methods ol 
estimation have a considerable bearing on the efficiency of surveys. His 
optimum allocation of units in sampling from a stratified population 
has been a clear demonstration of the possibilities that could be found 
along these lines. This is what exerted a significant influence on develop- 
ments which have taken place since 1934 in the theory of sampling surveys. 
Not only considerable research followed with the aim of developing new 
and more efficient methods of estimation, but the whole philosophy of 
sample surveys was built on this basis. The essence of this philosophy 
is expressed by the term “efficiency”. Within the framework of sampling 
history prior to Neyman's paper this philosophy did not exist. Since 
his 1934 paper it has become the goal, stimulating continuously new 
research in the theory of sampling surveys and its practical applications. 

The aim of these words is mot to separate the history of sampling 
methods into two periods which would have nothing or little in common. 
Neyman himself acknowledged Tschuprow's priority to the theory ol 
optimum allocation. “The foundations for the basic ideas of Neyman's 
1934 paper were already laid earlier. However, he was the first to put 
the available knowledge in a coherent whole with a clear understanding 
of the implications of the solutions and of the possibilities dealt with. 
Besides, he presented his idgas in the leading statistical periodical on the 
eve of a period ol history which was particularly favourable to absorb his 
results and convert them into a practical tool. Accordingly, it so happened 
that Professor Neyman's 1934 paper represented a turning point in the 
history of sampling methods. 
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In subsequent sections an attempt will be made to point out basic 
ideas and achievements which followed Neyman's paper. Obviously, any 
such attempt made by any individual worker is bound to be defective. 
Research into the theory and practice of sampling methods has been so 
extensive in recent years the world over that it hardly becomes possible 
to follow all of it. The present review has, therefore, been embarked upon 
with a clear understanding that it cannot possibly be fair with respect 
to the work done in many countries and published in less accessible 
languages and periodicals. 


Il. METHODS OF SAMPLING 


Stratified Random Sampling 


After Neyman laid down the principles governing stratilied randon: 
sampling, several investigations were carried out on different aspects 
thercof. The following are some of the principal results. 


Practical difficulties in adopting the Neyman method of allocation 


In the practical application of Neyman's method of allocation 
once is faced with certain limitations: if more than one characteristic is 
to be estimated from a survey, then the allocation of the sample into 


different strata on the basis of any one characteristic, using the Neyman 
method, may lead to loss in precision of estimates for other characteristics 
as compared to the method of proportional allocation. 


It should be mentioned at the outset that Neyman himself proposed 
the use in such cases of proportional allocation. Later on he pointed out 
the possibility that the optimum allocation can still be used if there is 
one characteristic more important than the others. In estimating totals 
and percentages, Hansen, Hurwitz and Madow (1953) found that in some 
cases a kind of combined procedure might be useful in the sense that 
optimum allocation is used to estimate totals, and increased sizes of samples 
are then used to estimate percentages from strata contributing sub- 
stantially to the sampling error. Jessen (1942) used a compromised alloca- 
tion by calculating the optimum allocation for each of the most important 
items and taking the average. This compromise is especially useful when 
the variation from stratum to stratum is markedly high. In a survey of 
a specialised type the correlations among the items may be high and the 
allocations may differ relatively little. Cochran (1953) gives a possibility 
for a “best” compromise in this case by minimizing the sum of the variances 
for the items, each divided by its optimum variance. Additional ideas 
are found in Snedecor and King (1942), Mahalanobis (1944), Dalenius 
(1957), etc. 

However, the most severe limitation on the use of the Neyman 
allocation is the absence of knowledge of the standard deviations within 
strata. One method of over-coming this limitation is to estimate the standard 
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deviations from a preliminary sample. These estimates will, however, be 
subject to standard errors and it is, therefore, possible that we would be 
worse off than if we had used the method of proportional allocation. 

With respect to this problem, Sukhatme (1935) investigated: 1) how 
frequently Neyman's method (using estimates of the standard deviation) 
will give more accurate results than the method of proportional sampling, 
2) the average gain in efficiency of Neyman's method over the others. 
It was found that almost invariably the precision of the estimate is increased 
if Neyman's method is adopted in preference to the method of proportional 
sampling. Further, the gain in precision is of considerable magnitude 
whenever the variability of the character sought within the single strata 
is very different. 

When the choice is between stratified and simple random sampling, 
Sukhatme showed that a small initial sample will usually give a high 
ore and that the optimum allocation will have a smaller variance. 
Evans (1951) examined the effect of errors in the estimated standard 
deviations and gave examples showing that very poor estimates would 
suffice to make “optimum” allocation better than proportional allocation, 
especially when the standard deviation differs markedly from stratum 
to stratum. 

Examination of the relative precision of stratified random and simple 
random samples showed that stratification, if properly used, nearly always 
results in a smaller variance of the estimated characteristics than is given 
by a comparable simple random sample. This does not mean that any 
stratified sample gives more accurate estimates than the comparable simple 
random sample. If the allocation of the sample among the strata is far 
from optimum, stratified sampling may have a higher variance. Also, 
the strata sizes are not accurately known, the estimates obtained from 
the stratified sample would be biased and the bias is independent of the 
sample size. 1f the sample size is increased, the variance component of the 
mean square error decreases while the square of the bias remains unchanged 
until a stage is reached of a certain size of sample beyond which the bias 
term dominates, and the stratificd sample becomes less accurate than a 
simple random sample. 

In applying the general principle of minimizing variance for a given 
total cost, the Neyman method of allocation is optimum only when the 
cost per unit is the same in all strata. When the cost per unit varies from 
stratum to stratum, useful results were obtained when the total cost within 
each stratum is proportional to the size of the sample. The results 


indicated, as would be expected, that sampling would be reduced from 
costly strata. 


The construction of strata 


The question as to how and how many strata should be 
constructed also received a good deal of attention. If one variable is to 
be estimated, then the best criterion for stratification would be its frequency 
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distribution or, if this is not known, the frequency distribution of some 
other characteristic that is highly correlated with the variable (Thionet 
1953a) such as the values of the variable itself in a previous survey. “To 
determine the optimum points for cutting up the frequency distribution, 
rules have been developed by Dalenius (1950) and Dalenius and Gurney 
(1951) for division under proportional and optimum allocation. Although 
there are obvious difficulties in applying these rules, their use under certain 
conditions gives good results (Straeker, 1957). 

As regards the number of strata, the studies showed that for a given 
sample size, under proportional allocation, the precision of the estimate 
generally increases as the number of strata increases. Hansen and Hurwitz 
(1943) advocate stratification to a degree where strata sizes are about equal 
and only one or few units are selected from each stratum. Stratification 
to this degree may secure a good spread of the sample but offers one 
disadvantage in that an unbiased estimate of the error variance cannot 
be made. We shall revert to this point later. 

If more than one variable is to be estimated, a scheme of stratification 
that is effective for one variable may not be so for another. What is 
needed in such cases is to choose for the criterion of stratification one or 
more variables that are correlated with the main items in the survey 
(Thionet, 1953a). Bases of stratification for economic items have been 
discussed by Stephan (1941) and Hagood and Bernert (1945), and for farm 
items by King and McCarty (1941). The efficiency of “geographic stratifica- 
tion”, which is based on the principle that “adjacent units are often more 
alike than units that are far apart”, has been examined by Jessen (1942) 
and Jessen and Houseman (1944). Their findings are that with geographic 
stratification the increases in precision from increased number of strata 
are moderate rather than large. 

Many other useful criteria for stratification are available. Tf the 
sample size is large enough a process of “multiple stratification” can be 
applied. That is, a stratification can be made first with respect to the 
most important criterion, each stratum can then be divided with respect 
to a second criterion, and so on. If the sample size is small, the application 
of multiple stratification does not become possible. A method of taking 
advantage of the criteria with an “incomplete stratification”, or what is 
called “deep stratification”, has been mentioned by Frankel and Stock 
(1942) and tested by Tepping, Hurwitz and Deming (1943). Through 
this method, it is possible to select a number of strata representing a larger 
number of strata. For example, if 27 strata are presented in a 3x3 latin 
square, 9 strata can be selected to represent them. In a 3x3 graeco-latin 
square, a fourth classification can be added, giving a representation of 81 
strata by only 9 cells (Cochran, 1947). 


Another form of stratification is that which is made after the sample 
has already been selected in order to improve the precision of an unstratified 
sample. This is done when the sizes of the strata are known but the list 
of units within each stratum is not available. After the sample is selected, 
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the units are classified into the corresponding strata and the sample is 
treated as 1f it were stratified. If the sizes of the strata are not known 
they can be estimated from a preliminary simple random sample and the 
character under study is observed on a sub-sample selected from the 
preliminary sample. This technique is known as “double sampling” and 
is due to Neyman (1938). Comparison of the precision of single with 
double sampling, taking cost into consideration, was made in order to 
know whether the reduction in variance would be worth the extra 
expenditure on the preliminary sample (Sukhatme, 1953). Assuming the 
cost of each sample is proportional to its size, and that the cost of surveying 
the preliminar, sample is less than one-third the cost per unit of surveying 
the main sample, the results showed that double sampling would be a 
more efficient procedure to adopt than simple random sampling without 
stratification. 

he theory of stratified sampling in combination with different 
methods of selection and of estimation, the calculation of the sample size 
needed to obtain the required precision, the optimum allocation of the 
sample with different cost functions, etc., were also develoned during the 
period under consideration. 


Cluster Sampling 


It was established in Neyman's 1934 paper that for a given sample 
size (i.e. a fixed proportion of the population) the use of individuals as 
sampling units spread over the population provides better representation 
and yields more precise results than the use of groups of these individuals 
as sampling units. The latter, however, is usually more economical. 
lherefore, the best size of sampling unit is that in which both precision 
and cost are considered; that is, the size which yields maximum precision 
lor a given cost, 

Hansen and Hurwitz (1942) used the name cluster for a group of 
elements (e.g. individuals) that constitute a sampling unit. Accordingly, 
sampling by groups is called “cluster sampling”. When the entire 
area containing the population under study is sub- divided into smaller 
areas and each element in the population is associated with one and only 
one such small area, the procedure is alternatively called “area sampling” 

For many types of population a list of elements is not available and 
the use of an element as the sampling unit is therefore not feasible, The 
method of cluster or area sampling was developed for use in such cases. 
lhus, in a city, a list of all the houses is readily available, but that of 
persons is rarely so. Again, lists of fields or farms are not available, but 
those of villages or of area sectors on maps are. For this reason, cluster 
and area sampling became widely practiced in sample surveys. 

The guiding theory for selecting the proper size of cluster has bcen 
investigated by a number of statisticians. Several attempts have been made 
to work out the relationship between the variance of the mean of a single 
cluster and its size. The first one was due to Fairfield Smith (1938). He 
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developed a function describing such a relationship when the elements 
of a cluster are not randomly selected, in which case they are usually 
positively correlated. He found the rel: rtionship to be satisfactory on yield 
data from uniformity trials for different size plots. Jessen ( (1949) showed 
that most economic characters relating to farm data follow a slightly dil 
ferent law from that of Fairfield Smith. He postulated that the mean square 
among elements within a cluster is a monotonic increasing function of 
the size of the cluster. “The same relationship developed by Jessen was 
independently suggested by Mahalanobis (1940). This was also the finding 
of Asthana (1950) who has fitted Jessen's law to describe the mean square 
within clusters for acreage under wheat for a large number of villages. 

In investigating the optimum size of the clusters the cost of the survey 
is considered as the sum of two components, one of which is proportional 
to the number of elements in the sample, and the other proportional to 
the distance to be travelled between clusters. Mahalanobis (1940) has 
shown empirically that the minimum distance between a number of points 
located at random is proportional to a function of the mane root of that 
number. By means of experimental work Jessen (1942) has shown that 
the approximation by the square root of the number of points works well 
in practice. The algebrai solution of the problem of choosing the optimum 
number and size of clusters was given by Cochran (1942), confirming the 
conclusions based on Jessen's empirical OS 


With urban sampling, the cluster is usually a household or a group 
of households. Hansen and Hurwitz (1942) present examples which show 
that for certain items in urban sampling the variance function is quite 
different from that used by Jessen. They also expressed their mathematical 
model in terms of the intra-class correlation coefficient, which has become 
a current concept in the discussion on cluster sampling. If all the units 
ot clusters are sampled, as was the practice in the earlier history of the 
use ol sample surveys, the losses in efficiency as compared to simple random 
sampling depend, on the one hand, upon the magnitude of the coefficient 
of intra-class correlation or, more generally, upon the internal homoge- 
neity of elementary units within clusters and, on the other hand, on the 
size of the clusters. Experience shows that the magnitude of the coefficient 
of intra-class correlation decreases as the size of clusters increases, with 
the rate of the latter being faster. The use of clusters has become a routine 
procedure in recent survey practice, either because of cost considerations 
or administrative convenience. The above knowledge of elements governing 
the efficiency of cluster sampling has helped the present survey practice 
to make full use of the advantages of cluster sampling and avoid, at the 
same time, the earlier inefficient designs based on clusters 


Sub-Sam pling 


lhe theory of cluster sampling has indicated that the larger the 
cluster, the less efficient it will usually be relative to the individual element 
as a sampling unit. “Therefore, for a given number of elements, greater 
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precision will be attained by distributing them over a large number of 
clusters than by taking a small number of clusters and enumerating them 
completely. In the first case, each cluster is sub-sampled, i.e. a number 
of elements is selected from each primary unit. When the sub-units within 
the same primary unit are sufficiently homogeneous, it is logical and 
profitable to have only a small number of them selected and, consequently, 
to sample more of the primary units. The optimum size of sub-sampling 
is that which balances between statistical precision and cost. 

The technique of sub-sampling, also called two-stage sampling, is 
particularly useful when the size of the primary unit is necessarily large, 
as may be dictated by the administrative division or the geographic 
boundaries of area units. Sub-sampling allows the convenient use of cluster 
sampling in a more efficient and a more flexible way. For this reason, this 
technique has a great variety of applications. lts use is also common in 
chemical, physical or biological tests, which are usually performed on a 
small amount of material, drawn as a sub-sample from a larger amount 
which is itself a sample. “Two-stage sampling can thus be thought of as a 
kind of incomplete stratification with the many units as the strata. 

The process of sub-sampling may be carried to more than two stages 
by sampling the sub-units instead of enumerating them completely. In 
surveys to estimate the yields of crops, the village is often used as the 
first stage unit, the field growing the crop as the second stage unit, and 
a small plot to be located within the selected field as the third stage unit. 
The crop in the selected plot is to be harvested for the determination ol 
the yield per acre. 1f further analyses of the crop are needed, additional 
sub-sampling may be used. 

The theory of sub-sampling was developed in connection with the 
sampling of plots in agricultural field experiments. In this case the 
population is infinite, sampling units are of equal sizes and an equal 
number of sub-sampling units are selected from each unit in the sample. 
The general theory for sub-sampling from finite populations has been 
developed for cases where the units at each stage of sampling are equal 
or unequal in size. Through the important contributions of Hansen and 
Hurwitz (1943, 1949), Sukhatme (1947, 1950, 1953), Sukhatme and Panse 
(1951), Sukhatme and Narain (1952), Yates (1949), Thionet (1953b) and 
others, estimators of various population parameters and their variances 
were made available for multi-stage designs in conjunction with stratifica- 
tion and with other sampling devices such as the selection with equal or 
unequal probabilities, selection with or without replacement, etc. 


Accounts of the planning and conduct of actual surveys involving 
two-stage sampling with primary units of unequal size are contained in 
the monograph “A Chapter in Population Sampling” (1950) and in 
numerous other publications such as that by Gray and Corlett (1950) on 
the British monthly surveys of sickness, Yates (1950), King and Jebe (1940) 
in sampling wheat fields in North Dakota, Jessen et al. (1947) and Jebe 
(1952). 
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Systematic Sampling 


In systematic sampling the first unit is selected at random and the 
rest are then taken at equal intervals one after the other. The wide 
application of systematic sampling is due to its simplicity and quickness 
in drawing the sample, as well as its convenient use in the field and in 
organizing control of field work. “The method, as used in the beginning 
by Bowley and others in the economic field, was frequently called quasi- 
random or stratified random sampling (Buckland, 1951), or mechanical 
selection in the Russian literature. The possibility that internal correlations 
might exist between the observed values, especially in populations which 
have certain order in space or time was not seen at that time. Such a 
possibility was first seen by Osborne (1942) in estimating areas under 
different types of cover (e.g. grass, woodland) from a map. In 1944 the 
sampling theory was investigated by W.G. and L.H. Madow, and was 
further elaborated by L.H. Madow (1946), Cochran (1946), Yates (1946, 
1948, 1949) and W.G. Madow (1949). Expressions were developed for 
the variance of the mean of a systematic sample, showing that the precision 
depends on the nature of the log correlations, such as are caused by any 
continuous variation in the items to be estimated. “Therefore, comparison 
between this method and others requires knowledge of the properties of 
the population. For some populations systematic sampling is highly precise 
and for others it is less precise than simple random sampling. For some 
populations and for certain sample sizes the variance of the mean of a 
systematic sample may even increase when a larger sample is taken (Labiri, 
1954, 1957). For these reasons, it is difficult to draw general conclusions 
about the effective use of systematic sampling without knowledge of the 
structure of the population. 

In practice, it is difficult to know the properties of the population. 
This fact has a considerable bearing on the application of the theory of 
systematic sampling. On the other hand, for populations in random order, 
e.g. for which lists of units are prepared in alphabetical or arbitrary 
order and where there is little likelihood of the lists corresponding to 
any physical distribution or of the existence of any correlation between 
neighbouring values, the systematic sample can be treated as a simple 
random sample. "The Madows (1944) have shown that the two variances 
are equal on the average. This important result led to an extensive use 
of systematic sampling as a convenient technique of selection rather than 
as a method of sampling. 

For populations with linear trend the Madows show that systematic 
sampling is more accurate than simple random sampling, but less accurate 
than stratified sampling. If the variation is periodic, the systematic sample 
is highly accurate if the interval is an odd multiple of half the period, 
but is inaccurate if the interval is a multiple of the entire period. Cochran 
(1946) considers a population model where the variance within a group 
of contiguous elements increases with the size of the group, i.e. they are 
serially correlated. If the serial correlation is positive, then the general 
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form of the correlogram is a monotonic decreasing function. In this case, 
the systematic sampling is always at least as accurate, on thg average, as 
the stratified random sampling. 


Systematic sampling is found to be both efficient and convenient in 
sampling certain “natural populations”, like forest areas for estimating 
the volume of timber (Hazel, 1942; Griffith, 1945-46; Finney, 1949), areas 
under different types of cover (Osborne, 1942), the number of seedlings 
im successive feet in a forest nursery bed (Johnson, 1943), estimating catch 
of marine fish in a sample of landing centers (Indian Council of Agricul- 
tural Research, 1950; Sukhatme, Panse and Sastri, 1958) and many others. 


Yates (1948) gives the practical aspects and utility of systematic samples 
for dealing with sequences of quantitative values, as well as with attributes. 
He deals with one dimensional systematic sampling and evolves new 
methods for estimating the sampling error. Simple end-corrections are 
proposed for eliminating the trend errors which are inherent in randomly 
located systematic samples. W.G. Madow (1949) extended the earlier 
results to the systematic sampling of clusters of equal and unequal sizes. 
Iwo methods are considered: 1) the enumeration of all elements in the 
sampled cluster, 2) stratification and sub-sampling in the sampled cluster. 
he most important conclusion is that systematic selection of clusters max 
not compensate for the increase in variance caused by the use of clusters. 

A more common use of systematic sampling is in second stage selection 
ol a two-stage design. This enables the selection of the second-stage units 
to be entrusted to the field staff without great risk of errors and facilitates 
control of field work. 

Quenouille (1949) and Das (1950) have compared two-dimensional 
systematic sampling with various types of stratified sampling in theoretical 
studies for some simple two-dimensional correlograms. A general conclusion 
is reached that an independent systematic sample in two dimensions gives 
more accurate results than a random sample. Buckland (1951) gives an 
interesting review of the literature of systematic sampling. 


III. METHODS OF SELECTION 


he name “random sampling” has often been used synonimously with 
“scientific sampling” or “probability sampling”. Random selection implies 
a known probability of an element or unit being included in the sample. 
he most common procedure of random selection is that with “equal 
probabilities”. In this case all units in the population (or stratum) have 
equal chances of being selected and the probability of selecting a unit at 
any draw is constant. Another procedure which has been recently developed 
is that of selection with “unequal probabilities”, as a means of increasing 
precision over sampling with equal probabilities. This is particularly 
important when the sampling units vary in size and the stratification of 
sampling units does not adequately remove such variation, or the stratifica- 
tion is conveniently based on characters other than size. 
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he probability of selecting an element in the sample can be set on a 
completely arbitrary basis. Hansen and Hurwitz (1943) introduced the 
selection of primary units (in a sub-sampling scheme) with probability 
proportional to some measure of their size for sampling of one primary 
sampling unit per stratum. When the sizes of primary sampling units or 
good estimates of them are available, Hansen and Hurwitz (1949) give 
a method of determining optimum probabilities of selection which will 
minimize the variance of the estimate for a given cost, and also give some 
approximation to the optimum . Midzuno (1950) has generalized the 
Hansen and Hurwitz approach to sampling a combination of n elements 
of the universe with probability proportional to some measure of size 
of the combination. Narain (1951) investigated the theory of sampling 
with variable probabilities when two units are selected from each stratum 
without replacement. Sen (1952) has developed formulae for a system of 
selection in which the first unit is chosen with probability proportional 
to size and subsequent units are chosen with equal probabilities (and 
without replacement). Horvitz and Thompson (1952) developed a general 
¿echnique for the treatment of samples drawn without replacement from 
a finite universe with unequal selection probability. “They discussed two 
sampling schemes in connection with the problem of determining optimum 
selection probabilities according to the information available on a supple- 
mentary variable. “The two schemes permit unbiased estimates of the 
sampling variance without resorting to additional assumptions. Durbin 
(1953) discussed Horvitz and Thompson's technique as the first solution 
to the problem of unbiased estimates of sampling error when sampling 
without replacement with unequal probabilities. An alternative estimate 
has been developed by Yates and Grundy (1953) for sampling without 
replacement from within strata with probability proportional to size. Their 
estimates seem to be better in specific situations. Said (19583) developed a 
simplificd system of selecting sampling units with unequal probabilities 
without replacement such that the probability of including units UU, 
together in the sample has a certain value. 


Cochran (1953) made a comparison between sampling with probability 
proportional to size and the ratio estimate derived from sampling with 
equal probabilities when the relation between the estimation variable y 
and other supplementary variables x is a straight line through the origin. 
The comparison is restricted to large samples. If the variance of y about 
the regression line increases faster than the variance of 7, 


sampling with 
probability proportional to size is more precise. Horvitz and “Thompson 
(1952) considered an empirical comparison between alternative techniques 
lor a specific set of data where y is approximately proportional to ». The 
two schemes which they introduced for sampling with unequal probabilities 
proved to be superior to the ratio estimate and the particular method of 
stratification they used. Said (1955) compared sampling with unequal 
probabilities with random sampling with a ratio estimate and with stratified 


random sampling, when the relationship between y and x is linear and 
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for certain distribution functions ol y. He found that sampling with 
unequal probability is more efficient than stratified sampling if the cor- 
relation between y and z is sufficiently large and the coefficient of variation 
C, is in the neighbourhood of C,. In these cases the ratio estimate is also 
more efficient than stratified sampling, and more efficient than sampling 
with unequal probabilities only for sample sizes greater than certain values. 

he method of sampling with varying probabilities and without 
replacement is difficult to use in practice, due to the heavy calculations 
involved in determining the selection probability for each unit in the 
population (or stratum), especially when more than two units are to be 
selected. In an attempt to simplify these difficulties without losing the 
advantage of sampling without replacement, Yates and Grundy (1953) 
suggested that the sampling could be done without replacement, but for 
estimating the mean and variance the sample can be treated as if it had 
been taken with replacement. They indicated the conditions under which 
the bias due to this modification is small. Sampling without replacement 
is, in general, more precise than sampling with replacement. However, 
when n/N is small, the chance that the same unit appears more than once 
in the sample is small, and the two schemes are practically equivalent. 
Singh (1954) compared the efficiency of the two systems of sampling and 
indicated the necessary conditions for all values of n, for sampling without 
replacement being more efficient than with replacement. 


IV. METHODS OF ESTIMATION 


In the course of searching for more efficient sampling systems there 
was a search for more efficient methods of estimation. If the probability 
density function of the estimation variable is known, the theory of statistics 
provides superior methods of estimation. If the survey deals with several 
items, the use of such methods requires knowledge of the distribution 
function. In fact, it is one of the advantages of sampling from finite 
populations that it does not require a rigid specification of the distribution 
function of the variable to be estimated. Therefore, the scope for new 
methods of estimation is necessarily limited. “Two methods have been 
developed for use in sample surveys and do not require knowledge of the 
probability density function of the estimated variable. These are the 
“ratio” and the “linear regression” methods of estimation. 

The two methods make use of the correlation between the variables 
and, under certain conditions, give more precise estimates than simple 
unbiased sample estimates. They involve, however, complex calculations. 
he labour required for such calculations may be more than offset by 


the gain in precision. For this reason, whenever there is supplementary 
information available, the sampler tends to utilize it in the method of 
estimation to gain efficiency. If the supplementary information is not 
available, the technique of double sampling is often used to obtain such 
information from a preliminary sample. “The additional cost of the 
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preliminary sample is usually justified by the gain in accuracy due to 
the use of supplementary information. 

The difficulty involved in the use of these estimates is that they are 
subject to unknown bias and no exact expressions for the bias and for 
the sampling variance of the estimates are available. For large samples, 
the bias is negligible and approximate expressions for sampling variances 
have been introduced. On this basis (i.e. for large samples), comparisons 
of the efficiency of the two methods relative to each other and to the 
simple unbiased estimate have been made. The issue depends on the size 
of the correlation coefficient £ and the coefficients of variation of the 
two variables, C, and C,. The ratio estimate is more efficient than the 
simple unbiased estimate if y > C,/2C,. When z is the value of y at 
some previous time, the two coefficients of variation may be about equal 
and the ratio estimate would be superior if f exceeds 0.5. The regression 
estimate is always more accurate than the simple unbiased estimate except 
when ¿is zero, in which case the two variances are equal. Moreover, the 
regression estimate is more efficient than the ratio estimate unless the 
regression of y on z is a straight line passing through the origin and the 
variance of y about the line is proportional to x, in which case both have 
equal variances. This is the situation where the ratio estimate is a “best 
unbiased linear estimate” in sampling from an infinite population 
(Cochran, 1912). This result is based on the application of Markoff's 
theorem on least squares. Des Raj (1954) suspects the validy of such 
application, since for the ¿'* unit in the sample, x, like y;,, is generally a 
random variable and not a known constant, as is assumed in the Markoff 
set up. In this connection it might be worth mentioning that Johnson 
(1950) has shown that in small samples, and with certain types of popula- 
tions, the ratio estimate is occasionally more efficient than the regression 
estimate. 

The regression estimate is more laborious to compute, principally 
owing to the work in calculating the regression coefficient. A simple 
method for obtaining an estimate of the regression coefficient was proposed 
by Wald (1947). This is done by separating the sampling units into 
two approximately equal groups on the basis of size, calculating averages 
for each group for both + and y and taking the ratio of the differences 
between the two averages of y and those of x. Bartlett (1949) suggested 
a more efficient estimate of the coefficient by dividing the sample into 
three groups and using the largest and smallest groups as above. However, 
even a highly inefficient estimate of the regression coefficient causes a 
trivial increase in the variance (Cochran, 1947). Nevertheless, the ratio 
estimate remains easier and is much more commonly used than the regres- 
sion estimate. 


Some bias appears in the use of the ratio method. Koop (1951) and 
Sukhatme (1953) have given approximate expression for this bias. Murthy 
and Nanjamma (1959) developed a technique to estimate the bias of an 


ordinary ratio estimate to a given degree of approximation on the basis 
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of inter-penetrating sub-sample estimates. The estimate of the bias is 
then used to correct the ratio estimate, thereby obtaining an almost unbiased 
ratio estimate. Goodman and Hartley (1958) have given an upper bound 
for the bias of the ratio estimate. They have suggested a new unbiased 
ratio-type estimate and have given conditions under which it is better 
than the usual biased ratio estimate. The case when the population mean 
of the auxiliary variate is not known has been considered by Sukhatme 
(1960). He has proposed an unbiased ratio-type estimate using the 
technique of double sampling and as given conditions under which it is 
better than the usual estimators. 


When the sample size is small, the distribution of the ratio is not 
known and the use of the ratio estimate becomes risky and no valid expres- 
sion for estimating the sampling variance is available. This situation is 
met quite frequently in practice when the population is divided into a 
large number of strata and the sample size within strata is necessarily small. 
Hansen, Hurwitz and Gurney (1946) use a combined ratio estimate over 
all strata instead of a separate ratio estimate for each stratum. The same 
thing was also applied in the case of a regression estimate. However, if 
the ratios or the regression coefficients are widely different from stratum 
to stratum, the combined estimates become inefficient. When the frequency 
distribution of the supplementary variable and its joint relation with the 
estimation variables are known, exact expressions for the bias and variance 
of the ratio estimate can be obtained. 

In recent years several workers have explored the possibilities of 
modifying the sampling scheme so that the estimate (retaining the character 
ol a ratio estimate) becomes unbiased. Lahiri (1951) gave such a sampling 
scheme where the sample is selected with probability proportional to its 
total size (of x). He also presented a convenient method for actually 
drawing the sample, which avoids the need for listing all possible samples 
and finding their total sizes and their cumulated sizes. 

Another simple procedure for drawing the sample in this case consists 
in drawing the first unit in the sample with probability proportional to 
size (of the auxiliary variate) and the remaining units with equal probabil- 
¡ties without replacement. This procedure of selection was given independ- 
ently by Midzuno (1950) and Sen (1952) for obtaining a sample with 


probability proportional to size. In this scheme an unbiased estimate of 
a particular general form turned out to be the usual ratio estimator. 
Lahiri also extended his method of selection to stratified sampling so as 
to get an unbiased ratio estimator. Des Raj (1954) has given the expressions 


for the variance and an unbiased variance estimator of the unbiased ratio 
estimator for uni-stage, stratified multi-stage and multi-phase designs. 
Nanjamma, Murthy and Sethi (1959) carry these techniques to more 
complex designs. In all the systems they consider, one unit is selected 
with probability proportional to its size on Y and the remaining units 
according to the original scheme of sampling. 
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In the ordinary use of the regression method it is assumed that ancil- 
lary information is available for all units in the sample. For information 
of this type, obtained through a double sampling technique, Sukhatme 
(1953) investigated the variance of the regression estimate. Another impor- 
tant use of the regression method is in successive sampling. In this case 
the same variate is observed on two successive occasions in time and only 
a part of the units observed are common to both occasions, and some are 
exclusive to each occasion. The observations on the earlier occasion are 
used as ancillary information to improve the estimate of the population 
value on the second occasion. Recurrence formulae between successive 
occasions and other relevant results have been given by Yates (1949), 
Patterson (1950) and Tikkiwal (1951) for the regression method of estima- 
tion. In their approach, however, the regression coefficients are assumed 
known whereas, in practice, they will have to be calculated from the sample. 
In order to take account of the variability of the sample regression coel 
ficient, Narain (1953) applies correction in the recurrence formulae by 
decreasing the square coefficient of correlation by a certain amount. These 
developments are particularly useful in evolving an economical system 
for collecting current statistics, making use of previous years” sample results 
by partially replacing its units in the year under consideration. 

In addition to the ratio and regression methods of estimation, the 
difference method should also be mentioned as an alternative (Hansen, 


Hurwitz and Madow, 1953; Zarkovié, 1956). This method is based on 
the difference between the actual value of a characteristic and the value 
of the supplementary information available for the same unit. ln some 
special cases this method has some fairly important advantages. A compar- 
ison of this method of estimation with a number of alternative approaches 


is given by Zarkovié (1960). 


V.  NON-SAMPLING ERRORS 


The classical theory of sampling is based on the assumption that the 
characteristic observed on any unit of the population takes a unique value 
whenever the unit is included in the sample, irrespective of the way the 
information is obtained. In the course of survey practice it has however 
become obvious that this assumption is not true. As a matter of fact, errors 
of various types unavoidably appear in all stages of statistical work. The 
net effect of these errors on the validity of the survey data needs careful 
examination. Indeed, the survey policy itself may need revision with the 
view to controlling such errors. This knowledge, together with the 
understanding of its full implications, is probably the most important step 
forward in the theory and practice of sample surveys since Neyman's 
1934 paper. 

As to how and where errors appear, we shall refer only briefly to the 
experiences accumulated. It is well known that the frame to start with 
may be inaccurate in the sense that some units may not be listed altogether, 
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while some others may be listed twice or oftener. “Phis may introduce 
biases of varying magnitudes since strata sizes, averages, totals or variances 
may be inaccurately estimated. Then, in selecting the sample, Kendall 
and Smith (1938) and Yule (1938) have shown that the tables of random 
numbers might themselves be biased or used in a biased way, and that 
further the staff responsible for the selection of the sample may often 
deviate from the instructions given, thereby changing the random structure 
of the sample. Again, the field staff may not always be able to correctly 
identify the units selected and additional deviance from randomness is 
introduced. Also, some persons to be interviewed may not be at home 
while some others may refuse to cooperate. In observational surveys the 
field staff may not reach the spot until after the event is over, as for 
example after the crop is harvested or before it is due as when the crop 
is immature and not ready to be cut. Incomplete samples may thus appear 
as a result of mon-response, refusals or non-availability of information. 
Errors may also appear in the process of obtaining information because 
the tools used, such as the tapes, balances and other instruments, may not 
be often precise. The questionnaires themselves may be a source of errors 
because of unprecise concept and definitions, leading questions, wording 
of questions, inadequate instructions, confusing lay-out of the material 
inconvenient size, etc. Many other sources of errors are connected with 
the respondent. These include ignorance of the field involved, lack of 
acquaintance with units of measurement, fear and suspicion, prestige, 
memory shortcomings, etc. Then comes the enumerator who shapes data 
according to his own ideas, fails to understand the instructions and makes 
errors in recording and transcribing information. Errors also occur in 
editing, coding, tabulation and printing. In addition, in some cases biased 
methods of estimation are used and computational errors are made. Further 
details on errors are found in Deming (1944, 1950), Thionet (1953b), 
Hansen, Hurwitz and Madow (1953), etc. 

The treatment of incomplete samples or of non-response was first 
given by Hansen and Hurwitz (1946), who developed a method that makes 
it possible to get unbiased estimates from mail surveys resulting normally 
in a high rate of non-response. Their solution consists in selecting a sub- 
sample from the non-responding stratum for the purpose of getting 
information by interviewing. The solution provides for the optimum 
sub-sampling fraction within the given rate of non-response and the 
precision aimed at or the budget allotted. Another solution of the same 
problem originating in interview surveys is due to Politz and Simmons 
(1949, 1950) and Hartly (in Yates' 1946 paper). A respondent is asked 
how many times he was at home during the last five days at the time of 
the survey. Six strata of respondents are thus obtained and data for each 
of them are weighted with the probability of a person being at home in 
a particular stratum. The problem was also studied by Birnbaum and 
Sirken (1950) who determined the size of the sample that minimizes the 
root mean square error; Deming (1953) who insists on recalls as the most 
efficient way, under given circumstances, of reducing the root mean square 
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error and makes an attempt to determine the optimum number of recalls; 
Durbin (1954) who examined the information on cost of recalling and 
its consequences; Hendricks (1940), Cleason and Ford (1947) and Finkner 
(1952), who studied the adjustment of data for bias coming from non- 
response; and Dalenius (1955) who dealt with the question of getting data 
on non-responding units while the survey is still going on. 

The need and importance of controlling errors in field work was first 
stressed in India by Mahalanobis (1941) who suggested the technique of 
interpenetrating samples for the purpose. However a systematic theoretical 
treatment of the enumerators' variability would seem to have been first 
developed only in 1951 by Hansen et al. and again independently by 
Sukhatme and Seth (1952), and Sukhatme (1956). Using different models 
for the structure of response, these authors developed formulae which 
made it possible to estimate the enumerators' contribution to the variation 
of sample estimates. “Their results show that the classical formulac under 
estimate the actual sampling variance to which the estimates are subject, 
although for large populations the estimates of the sampling variance 
based on the observed values using the classical formulae would include 
the component of the enumerators” variability. “These studies also show 
that interactions between the enumerator, the units included in the sample 
and the values of the characteristics under observation bring about very 
complex theoretical problems which need further consideration for arriving 
at a satisfactory estimate of errors applicable to sampling from finite 
populations. 

Among the survey problems which facilitated the development of 
studies on these non-sampling errors and helped them to clarify a number 
of important points in the origin and treatment thereof, the most prominent 
was by far the problem of yield estimation based on sample harvesting 
ot small areas. Here the biases could be ascribed to at least three different 
causes: i) arising from inclusion (or exclusion) of plants strictly falling 
outside (or inside) the demarcated area; 1i) the distribution of sample 
harvesting of cuts over time not corresponding with the distribution of 
actual harvests in practice, or 111) failure to ensure the same chance for all 
parts of a field being included in the sample. Data on the problems involved 
in the yield estimation are found in King and Jebe (1940), Sukhatme 
(1945, 1946, 1947), Mahalanobis (1946), Hendricks (1948), Panse and 
Sukhatme (1948), Mahalanobis and Sengupta (1951), and Pense (1954). 

Interview surveys likewise helped in the clarification of the source 
and magnitude of non-sampling errors arising from memory biases, such 
as on how events fade out of the memory, how the fading out varies from 
one item to another, what reference period is to be used in collecting 
various statistical data, what is the magnitude of end-effects, etc. Although 
the present knowledge about such questions is far from satisfactory, some 
interesting and encouraging results were reported by A. Gosh (1953), 


Mahalanobis and Sen (1954), Zarkovié (1954), Das Gupta, Som, Majum- 
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dar and Mitra (1955), Gray (1955), Cole (1956), Cole and Utting (1956), 
Das Gupta and Mitra (1958), Som (1959), etc. 

These are examples of studies originating from the need of building 
up a new theory of sample surveys that will take into account the existence 
of different types of non-sampling errors. We are at present only at the 
beginning of activities in this direction. It should be emphasized however 
that the available knowledge, although modest, has already exerted a vast 
influence on survey practice. In preparing survey designs, samplers fell 
an obligation to plan measures with the aim of improving the accuracy 
of data. As a result, pilot surveys conducted with a view to getting informa- 
tion on the different errors to be expected under a given set of circum- 
stances and their relative magnitude, together with the means of correcting 
or minimizing them, have become a part of the modern survey routine. 
Similarly, after a survey has been taken, or in the course of it, it has also 
become customary to conduct quality checks to evaluate the magnitude 
of biases and errors present in data. Such checks are used particularly in 
censuses where they are known under the name of post-enumeration checks. 
Their aim is to inform users of data on the degree of accuracy of census 
data and statisticians on the shortcomings of methods used in the col- 
lection and tabulation of data. 


Many other practices are also worth mentioning in this connection to 
illustrate characteristics of modern survey work. For example, when . 
sample was selected in earlier practice it was used basically as it was 
selected. The present practice is to take all possible care in ensuring the 
randomness of the samples, and there is also a tendency to check how far 
the selected samples satisfy the criteria of the randomness. This is primarily 
so in census work where selection biases easily appear (Stephan, Deming 
and Hansen, 1940). H some such biases are found, the sample is often 
adjusted by adding or removing a requisite number of units. There is 
also more care in preparing questionnaires, which are known to be re- 
sponsible for many errors in surveys (Payne, 1951), in training of field 
staff and in supervising different stages of work. In the process of collecting 
data in the field it has become clear that the accuracy of information largely 
depends upon the source of information. Attempts have therefore been 
made either to adopt an objective procedure of selecting the respondent 
(Kish, 1919; Thionet, 1953b) or to call the enumerator's attention to the 
importance of the source of information and ask him to find the best 
respondent in the household. Another development worth mentioning in 
this connection is the increasing interest in the use of objective methods 
for collecting data. This makes it possible to keep the accuracy of data 
independent of the respondent, his ignorance, suspicions and other motives. 
At the present time when statistical activities are fast developing in 
less developed countries, the use of objective methods is being further 
emphasized as the only practical means of getting data with satisfactory 
accuracy. 
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VI. PLANNING SAMPLE SURVEYS 


Planning sample surveys is another field where considerable changes 
have taken place since the publication of Neyman's paper in 1934. It was 
in tbis paper that the idea of the rational sample design first appeared 
in the sense that an attempt was made to minimize resources for a given 
precision or vice versa. “This idea was further developed in subsequent 
studies and various cost functions were established with the aim of achiev- 
ing the most efficient sample design under different conditions. The 
means of arriving at the optimum consisted in a skillful combination ol 
various sampling and estimating procedures, the use of supplementary 
information, cost elements, etc. The cost problem in its various aspects 
has thus become a primary concern of the present survey practice. A good 
illustration of how far it might go in various fields with respect to earlier 
survey practice is found in the present approach to the computation of 
sampling errors, where a continuous effort to reduce cost further and 
further has resulted in many important innovations. “The modern tendency 
towards increasing survey programs to cover hundreds of items makes 
it impossible to apply the computation procedures for the variance ol 
the estimators that result directly from the sample design adopted. The 
volume of computation would simply be prohibitive. This particularly 
holds true of the use of sampling methods in census work which often 
leads to hundreds of thousands of sample estimates published in census 
reports. 

Regarding this situation a number of attempts have been made in 
recent years to reduce the computational work. 1f the number of estimates 
is not too large, a sufficient reduction in computation is obtained by 
selecting a subsample of units and estimating the variance therefrom. With 
stratified samples and within strata variances constant, or nearly so, a 
pooled estimate of variance can be readily obtained. In doing so, sub- 
sampling might also be useful in some cases. For a large number of strata 
and varying within strata variances, the technique of grouped strata was 
recommended by Hansen, Hurwitz and Madow (1953). 

Another group of shortcuts is based on the fact that the variance ol 
the values for two units can be obtained from the square of the difference 
between these two values. Yates (1949) recommended the use of this device 
in estimating variances of a stratified sample with two units from each 
stratum. In estimating totals from the same type of sample, Keyfitz (1957) 
applied a similar approach. “Thionet (1959) generalised the procedure 
and showed the possibility of using squares of differences in estimating 
the variance of any size of sample. Obviously it will only be useful in 
practice in the case of stratified samples with three or four units per 
stratum. 

Another technique, described by Hansen, Hurwitz and Madow (1953) 
consists in dividing the sample into t random groups of k units each and 
estimating the per unit variance from sample totals. 1f supplementary 
information is used, computational reductions are obtained by the propel 
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choice of the method of estimation. In other cases it was found uscful 
to adopt some special design which implies an easy computation of 
variances. Such is the Deming (1956) technique based on replicated 
samples. Finally, increasing interest should also be pointed out in the 
use of ranges and other statistics to achieve similar effects. 

he techniques reviewed here are very useful in sample surveys with 
a moderately large program. In census work and multi- -purpose surveys 
the need was felt to go further toward reduction of computation or, in 
the extreme case, towards eliminating it altogether. In this direction an 
interesting attempt is being made in the Indian Statistical Institute. The 
design of interpenetrated samples is being adopted and sample data are 
being tabulated for each subsample separately. An example of a different 
approach is found in Yates and Finney (1942). In a survey of wire-worm 
infestation they plotted the estimated number of wire-worms per hectare 
against the percentage sampling variance and found that the relationships 
established can well be used in predicting variances in fields not included 
in the computation as well as in similar surveys taken a year later. This 
raises the question of the stability of variation over time. If it is found 
to exist with a given characteristic it makes it possible to use, in a new 
survey, the relationships established in the past and eliminate accordingly 
the computation of errors altogether 


A step forward in the same direction was made in the U.S. Bureau 
of the Census. In studying the shortcuts that could be efficient enough 
in monthly sample surveys with many items on the program and in the 
use of sampling methods in census work with thousands of sample estimates, 
it was discovered that the relationships of the above type do not need to 
be different for different items. Instead, it was demonstrated that the 
same relationship holds satisfactorily for the whole group of items such 
as labour force, housing, etc. Hansen, Hurwitz and Madow (1953) have 
shown that it is possible to establish such relationships on the basis of 
old data and apply them on new estimates as soon as they become available. 


These are typical developments in the present sample survey practices 
that are dominated by a kind of efficiency pressure which explains the 
direction of theoretical endeavours and practical aims. 


Another line of efforts in planning sample surveys is concentrated 
around non-sampling errors. After the implications of the existence of 
errors in data were fully understood, it became clear that a rational sample 
design does not necessarily mean securing maximum information at a given 
level of resources. A very efficient design from the precision point of view 
might have but poor efficiency from the accuracy point of view. A good 
illustration is furnished by comparing an interview survey intended to 
get data on areas under various crops and yields per hectare in a country 
where the population is largely ignorant of area units, to a survey based 
on objective methods. Obviously the rationalization had to be extended 
to include all the stages of a survey so that the total error in estimates is 
taken into account. 





MAJOR DEVELOPMENTS IN SAMPLING 673 


The new developments put additional burdens on the statisticians' 
shoulders. Before they are able to plan and carry through a sample survey 
they need to acquire a broader knowledge of the survey field than did 
their older colleagues some twenty years back. “This is why so much 
emphasis is being placed today on experimentation and pilot surveys as 
a rational way of obtaining all the requisite information for planning 
purposes. This is also why budgeting statistical surveys tends to take a 
different shape in modern practice where considerable resources are being 
put in the systematic collection of all the relevant information on errors 
in surveys and studies thercof. Under the continuously changing circum- 
stances with respect to the different elements involved in planning statistical 
surveys, one may never reach the stage where further knowledge on errors 
would become worthless for improving the efficiency of work. A permanent 
research activity has thus become a prerequisite for attaining high efficiency 
in planning sample surveys. This is a distinctive feature of recent deve lop- 
ments, which needs to be considered in any systematic approach to organize 
survey work. 


VIl. APPLICATIONS 


In early days, sample surveys were distrusted by statisticians and non 
statisticians alike and therefore their use was very much limited. The 
developments towards increased appreciation and confidence in the use 
of sample surveys were stimulated by the 1925 Session of the International 
Statistical Institute where an expert commission presented a report on the 
“representative” method. 

The publication of the subsequent de velopments i in statistical journals, 
together with meetings, conferences, seminars and symposiums have ac- 
celerated the expansion and refinement of sampling techniques and the 
increase of confidence in their application. In the past few years scientifie 
sampling methods have been employed extensively in descriptive and 
analytic studies and in large-scale agricultural and socio-economic surveys. 
With the adoption of planned economy, modern sampling has been used 
increasingly to obtain requisite data for economic planning. Sampling is 
stredily extending to many other fields such as commerce, industry, 
education, forestry, fisheries and government administration. Sampling 
has become a necessity for use in one or more stages of the census and 
sometimes as a substitute for a census. More recently, sampling has been 
used in combination with controlled experiments to obtain better evalua- 
tion of cause-and-effect relationships under a wide range of conditions. 


During the last decade or so, the use of modern sampling techniques 
has gained world-wide acceptance largely due to the promotional work 
of several United Nations agencies. In the field of agricultural statistics, 
the Food and Agriculture Organization (FAO) has been attaching particular 
importance to the use of sampling in the improvement of national statistics. 
FAO recognizes that a census, however desirable, often cannot be taken 
at all, at least in less developed countries, owing to the large expense and 





674 JASI, EsrAbísTICA, DICIEMBRE 1959 


effort it involves. A method is needed which is economical and which 
the countries can afford and yet which promises sufficiently reliable 
results. Random sampling in FAO's view provides the solution. FAO 
has therefore undertaken an extensive program of preparing and publishing 
information on the use of the method of random sampling in practice and 
also providing the governments direct assistance in introducing the method 
of random sampling in their respective countries. This Expanded Technical 
Assistance Program plays an important part in promoting the more 
extensive use of sample surveys. Pilot sample surveys and sampling 
programs have been, and are being, promoted through the work of experts 
and consultants engaged in assisting governments to organize better 
machinery for collection of statistics. Many helped to set up a national 
sample survey for current agricultural statistics. Others helped to improve 
the crop reporting system. Still others helped in introducing objective 
methods of crop estimation. The plans of surveys initiated by these experts 
have naturally varied widely according to local conditions. Adaptation 
of available techniques to local conditions has sometimes called for 
solutions of new technical problems. 


Realizing that the use of random sampling is relatively new and that 
there is a lack of trained personnel in the theory and the use of the sampling 
method, FAO has organized training centers in various regions of the 
world for demonstrating in actual practice the possibilities of the method 
of sampling. The samples for the demonstration were designed by the 


participants themselves with the help of the experts at the centers. The 
participants conducted the surveys and appraised the results. These centers 
have provided the participants with opportunities for developing the 
samples under conditions similar to those in their own countries. At the 
first of these demonstration centers, FAO secured the services of Professor 
Neyman himself. 


In organizing these training centers, seminars and other promotional 
and coordinating activities, FAO cooperates with the Statistical Office and 
the Statistical and Economic Commissions of the United Nations, and 
inter-governmental organizations such as the Inter American Statistical 
Institute and the Organization of European Economic Cooperation and 
with the regional conferences of statisticians. 

FAO's program for the 1960 World Census of Agriculture, while giving 
due emphasis to complete enumeration, draws attention to the importance 
of the role sampling can play in agricultural censuses. In fact, the develop- 
ments in sampling techniques, taken as a whole, find a more fruitful field 
of application in agricultural censuses than perhaps in any other census. 
The chief reason for this is the very large and steadily increasing number 
of items nowadays included in the program for an agricultural census. 
Sampling offers the possibility of enlarging the scope of the census at a 
reduced cost. Moreover, the nature of the items in an agricultural censms 
requires a high quality of enumeration and, in the case of some items, 
even the use of objective methods where practicable. By means of sampling, 
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improved accuracy is made possible through closer supervision and intensive 
training of comparatively few enumerators. 

In some countries sampling has been used in lieu of a complete agri- 
cultural census. In others, complete enumeration is made of all items of 
the census. “The use of sampling as an alternative to a complete census 
is scarcely appropriate for countries where smallness of territory goes in 
hand with large variations in agricultural structure within the country, 
or where accurate statistics for the smallest geographic or administrative 
divisions may be needed to implement correct agricultural programs. 

A third group of countries uses sampling in conjunction with a census. 
FAO has placed special emphasis on the usefulness of this procedure 
which is becoming more and more recognized by countries in connection 
with the 1960 World Census of Agriculture. “The question is rather one 
of determining what parts of the program lend themselves to the use 
of sampling as an adjunct to, or even an integral part of, complete 
enumeration. The main directions in which sampling promises to be of 
use in this way are in broadening the scope of the census, in processing 
census returns, in providing pre-testing surveys, post-enumeration and 
other quality checks. 
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EL MUESTREO Y LA SITUACION ACTUAL DE 
LA ESTADISTICA 


FRANCISCO Azorín Poch, España * 


SUMMARY 


Phe development of probability sampling techniques has 
been extraordinary, even in comparison with the advancement 
of mathematical statistics theory and methods, especially since 
Professor J. Neyman's published work in 1934. Although interest 
already existed, its diffusion was limited before that date. After 
1934 there was a rapid increase in the number of publications 
on theoretical and practical aspects of sampling. 

l'he publication of textbooks was begun some 10 years ago 
with one by F. Yates, followed by others in the United States 
of America, of either a general or specialized nature in certain 
fields of application. There were also chapters devoted to this 
topic in books on general statistics. 

here are numerous contributions relative to sampling 
procedures by clusters or areas, by stages, division into strata 
and allocations, and systematic sampling. 

Optimum methods for the appraisal of precision and degree 
of certainty, evaluation of non-sampling errors. comparison of 
the efficiency of different sampling plans, etc., are among the 
problems still pending satisfactory solution. 

An interesting aspect is the influence on sampling of the 
evolution of statistics, development of experimental sciences, and 
the evolution of mathematics. 

If on one hand the characteristics of uncertainty, the unity 
of knowledge and applicability prompt the advancement of 
statistics in all directions; on the other hand the critical situation 
influences all fields of activity, but more intensely the statistical 
field because of what it is and its hybridism. New requirements 
have brought about the review of the axiomatic theory of 
probabilitv. Research is mecessary for the different concepts 
related with the idea of inference, and more concretely with 
estimation by intervals. One should study the significance of 
randomness and related considerations. 

Discussions have been initiated which still cannot be 
considered resolved concerning the statistical profession and the 
ideal preparation for it. The work of the statisticians, particu- 
larly those engaged in sampling, will be affected by the possible 
solution of the above problems or of those which may arise 
in the future 


I. INTRODUCCIÓN 


El desarrollo en las técnicas del muestreo probabilístico de poblacio- 
nes finitas se destaca vigorosamente aun tomando como fondo el formi- 
dable avance de la teoría y métodos estadísticos en los últimos decenios. 
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Hace 25 años, los estudios relativos a la selección efectiva de subcon- 
juntos representativos, se encontraban apenas esbozados o al menos muy 
restringidos en su utilización. En 1934 apare ió el ya clásico artículo del 
Profesor J. Neyman [25], sobre afijación óptima en el muestreo estratifi- 
cado aleatorio, que actuó como un poderoso catalizador en el campo de 
las investigaciones muestrales. 

Parece ser que en Rusia se utilizaron métodos de muestreo antes de 
la primera guerra mundial, según diseños dirigidos por A.A. Tschuprow, 
pero que alcanzaron poca difusión fuera de sus fronteras. Se citan asimismo 
(véase Larkovié [43] ) diversos nombres de estadísticos universitarios y 
administrativos, que se anticiparon en dicho país a los principios y reali- 
zaciones de Kiaer, director de la Oficina Central de Estadística de Noruega 
a finales del siglo pasado, así como a Carroll D. Wright, en los Estados 
Unidos y a A. Bowley, en la Escuela de Economía de Londres. Sin em- 
bargo, en años posteriores a 1930, el punto de vista soviético dejó de ser 
favorable a este florecimiento, al considerar la Estadística como un ins- 
trumento exclusivo para la planificación de la economía nacional, con 
base político-social y no universalista y matemática. 


Por otra parte, en los países occidentales el número de publicaciones 
y de muestras seleccionadas aumentó con velocidad creciente a partir de 
tales años. Numerosos trabajos sobre aspectos teórico prácticos del mues- 
treo fueron apareciendo y continúan publicándose en revistas de Estadística 
teórica y aplicada como Journal of the American Statistical Association, 
The Annals of Mathematical Statistics (em los Estados Unidos); Applied 
Statistics, Biometrika, Journal of the Royal Statistical Society (Series 
General y Metodológica, en Inglaterra); Sankhya (en India); Skandinavisk 
Aktuarietidskrift (en los países escandinavos); Trabajos de Estadística (en 
España), etc. y la que publica el presente artículo así como en varias espe- 
cializadas en otros dominios, entre ellas Biometrics, Journal of Agricultural 
Science, Journal of Marketing, American Sociological Review, Publi 
Opinion Quarterly, American Journal of Public Health, etc. 


Más recientemente comenzaron a editarse textos de muestreo. En 1949, 
F. Yates [41] publicó su Sampling Methods for Censuses and Surveys. No 
es, naturalmente, simple coincidencia que este primer texto procediera de 
un diseñador de experimentos y de una estación experimental como 
Rothamsted. La frontera entre ciencias de observación y de experimenta- 
ción no está claramente delimitada, a pesar de lo mucho que se ha escrito 
sobre esta cuestión, como ha puesto de relieve Savage [30]. Ni la preten- 
dida diferencia entre el OS dor como elemento activo y el obser- 
vador como ente pasivo, ni la distinción según la cual el experimentador 
actuaría sobre el objeto mientras que el observador solo actuaría sobre sí 
mismo, ni la propiedad de poder reproducir y y repetir los experimentos 
pero no las observaciones, a voluntad del sujeto que experimenta u observa, 
son aplicables con suficiente generalidad para que la clasificación sea 


Ac 


satisfactoria. Por ello es de esperar una más íntima integración del diseño 
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de experimentos, basado principalmente en el análisis de la varianza, con 
el muestreo estadístico, tal como hoy se entienden ambos dominios. 
Volviendo al libro de Yates, es conveniente recordar que con él se 
inició un período de publicación de tratados sobre muestreo probabilístico 
de poblaciones finitas. En los Estados Unidos aparecieron sucesivamente 
E textos de Deming [11], Cochran [7], Hansen, Hurwitz y Madow [12] 
Hendricks [13]; la Organización de las Naciones Unidas para la Agri- 
na y la Alimentación publicó el de Sukhatme [36], todos los cuales 
han alcanzado amplia difusión. Más recientemente aparecieron los textos 
de Moser [24], Stuart [35], Dalenius [10], etc. aparte de varios libros sobre 
análisis de mercados y de los que tratan con preferencia de inspección por 
muestreo, control de la calidad, muestreo sucesional y otras aplicaciones 
industriales. Numerosas obras de Estadística General dedican también uno 
o más capítulos al muestreo, como ocurre en las de Mood [23], Ríos [29], 
Wallis y Roberts [39] y tantos otros. 


Además de las traducciones de algunas de las obras anteriormente men- 
cionadas, se han publicado directamente en español, portugués y francés 
textos como los de Cansado [4], Madow [21] y Thionet [38]. La revista 
Estadística Española viene publicando asimismo una sucesión de breves 
artículos sobre procedimientos de muestreo. Quien sólo esté interesado 
en obtener una información general sobre métodos, puede consultar las 
normas de las Naciones Unidas [27] y artículos expositivos como el de 
Slonim [31], y los que presentan, en forma resumida, la evolución de la 
teoría y técnicas del muestreo como los de Stephan [32] y You Poh Seng 


[42]. En algunas de las publicaciones citadas se nota un cierto matiz pro- 
pagandístico que se manifiesta al comentar la longitud de la relación de 
países e instituciones que utilizaron con éxito métodos de muestreo. Dicho 
matiz se justifica por la desconfianza, que por cierto aun perdura en algunos 


medios, hacia toda estadística que no se base en una enumeración com 
pleta o exhaustiva. 


Entre las mumerosas aportaciones originales en los últimos cinco años, 
pueden mencionarse los trabajos de Masuyama [22j, en los que se aplican 
fórmulas de geometría integral (las de Crofton, Poincaré, Blaschke y 
Santaló) a problemas de muestreo por áreas. Otros trabajos de interés son 
los de Basu [3], que estudia la selección de unidades primarias con reem- 
plazamiento, sin reemplazamiento y con estimaciones iguales o indepen- 
dientes en el muestreo bietápico y el de Chakravarti [5]. Se ocupa éste del 
planeamiento de un muestreo polietápico para caracteres multiplemente 
correlacionados. 

Tosio Kitagawa [18] considera la afijación óptima en el supuesto de 
información completa relativa a los parámetros poblacionales, compara la 
eficiencia de distintos diseños aplicando la desiguaidad de Schwarz-Holder, 
y estudia un sistema de estratos aplicable a muestras repetidas. Los pro- 
blemas de interés teórico o teórico práctico como el estudio concreto de 
la eficiencia comparada de muestras bietápicas, según que el número de 
unidades secundarias por unidad primaria sea constante o variable, no 
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significa apartamiento de las aplicaciones, como la consideración del error 
en experimentos de entresacado de cosechas o la obtención de números 
aleatorios para su empleo inmediato. 

En el muestreo sistemático, tan utilizado en la práctica por los esta- 
dísticos británicos, y que como es sabido origina dificultades en la estima- 
ción, excepto en los casos más sencillos, se han realizado aportaciones 
importantes como la de Gautschi, quien compara la generalización del 
muestreo sistemático debida a Tukey y expuesta por Deming [11] con el 
procedimiento sistemático que emplea un solo origen aleatorio, para una 
muestra del mismo tamaño. Se extienden así los resultados de los Madow 
y los desarrollados por Cochran en sus artículos y texto [7]. También 
deben citarse los trabajos de Dalenius y Hodges, sobre división de la 
población en estratos, y los referentes a la selección de conglomerados con 
probabilidad proporcional a su tamaño, como el de Stevens [34]. 

Cabe decir, pues, que la situación es, en general, satisfactoria en 
cuanto a la cantidad y calidad del material de que se dispone. Sin embargo, 
para no dejarse llevar por una excesiva complacencia, es conveniente exa- 
minar ciertas cuestiones que no pueden aun considerarse resueltas, así 
como algunos de los puntos más expuestos a crítica. 


II. PROBLEMAS ACTUALES 


Stephan y McCarthy [33], señalan entre otros problemas persistentes, 
los de establecer cuales son los métodos óptimos para apreciar la precisión 
y el grado de certeza de las estimaciones obtenidas, teniendo en cuenta 
lo que hay de convencional en las actuales medidas del error de muestreo; 
el estudio de la adaptación de los entrevistadores a las diversas condiciones 
locales o individuales y la evaluación de los errores ajenos al muestreo; 
la determinación de la eficiencia y adecuación relativa de diseños y planes 
generales de muestreo, cuando sean tan diferentes que se haga difícil su 
comparación; la coordinación de informaciones censales y muestrales reco- 
gidas por diferentes organismos y países, cuyos propósitos coincidan 
parcialmente. 

Con criterio más amplio y desde un punto de vista menos próximo, 
deben tomarse en consideración las repercusiones en el muestreo de la 
situación de transformación y crecimiento de la Estadística, el desarrollo 
de las ciencias de observación y experimentac ión y la evolución de la 
misma matemática. Es innegable la singular importancia de la posición 
de la Estadística por su carácter de ciencia de lo contingente, que hoy 
invade las demás disciplinas; por su papel preponderante en los esfuerzos 
hacia la síntesis y la unificación, y por su carácter instrumental como 
tecnología de la investigación científica (véase, por ejemplo, Mood [23] ), 
y su consiguiente presencia en el diseño y en el análisis de toda ciencia 
de base experimental. Estas características de incertidumbre, unidad del 
conocimiento y aplicabilidad, impulsan el avance de la Estadística en 
profundidad y en extensión. Por otra parte, la situación general de crisis 
en épocas como la presente, y el temor ante la responsabilidad en las 
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decisiones o simples afirmaciones, influyen naturalmente en la Estadística 
como en todos los campos de actividad humana. Pero, la posición de ésta, 
queda agravada por su mismo modo de ser y por sus características de 
hibridismo. La misma teoría de la probabilidad, aun pudiendo conside- 
rarse como una rama especial de la matemática, que se separa de la teoría 
de la medida o de las funciones de conjunto aditivas al introducir el 
concepto de independencia, sufre de una intensa crítica en lo que respecta 
a sus fundamentos. En 1919 podía sostenerse con von Mises que el cálculo 
de probabilidades no era aún una disciplina matemática. Quedó superada 
tal situación al publicarse en 1933, la fundamentación de Kolmogorov [19], 
quien siguiendo la interpretación frecuencial del mismo von Mises y 
utilizando los recursos matemáticos de Lebesgue, Fréchet y otros matemá- 
ticos, superaba la época preaxiomática con un sistema de postul: idos claro 
y riguroso. En los años de pleno auge del frecuencialismo, los estadísticos 
de tendencias subjetivistas, como Sir Harold Jeffreys, eran considerados 
como una especie de heterodoxos. Así, en Cambr idge (Inglaterra) en los 
cursos universitarios, para el diploma de Estadística, que se seguían hasta 
hace pocos años bajo la dirección del malogrado Dr. J. Wishart, gran 
parte de los oyentes del Profesor Jeffreys eran físicos, astrónomos u otros 
científicos atraídos por su renombre en física-matemática, mientras que 
los estadísticos propiamente dichos asistían, salvo excepciones, por respecto 
o curiosidad de escuchar tesis ajenas a las vías principales de desarrollo 
de la disciplina. Tenemos que reconocer que en virtud de los nuevos re- 
querimientos, la situación ha variado suficientemente en estos últimos 
años para que haya que volver los ojos, una vez más, a los fundamentos, 
no sin ciertos temores y aprensión explicables, ya que ésto siempre obliga 
a pisar un terreno batido. Ya no es sólo la voz del matemático la que se 
oye en este campo sino también la del filósofo, la del semántico, la del 
economista y la del psicólogo. 


III. INFERENCIA, DECISIÓN Y MEDIDA DE LA CONFIANZA 


Las afirmaciones referentes al mundo real efectuadas con base en la 
observación (incluyendo también experimentación) constituyen, en sentido 
amplio, la inferencia estadística . 

Más estrictamente puede definirse esta inferencia como una afirma- 
ción relativa a poblaciones estadísticas, basada en ciertas observaciones y 
con determinada medida de la incertidumbre. 

D.R. Cox [8] establece como caracteres distintivos de la inferencia 
estadística, dentro de las inferencias en general o conclusiones dudosas, 
las siguientes: 

1. Que la información en que se apoye sea estadística, esto es, consista en 
observaciones sujetas a fluctuaciones aleatorias 


2. Que se reconozca, empíricamente, la incertidumbre de las conclusiones, a la 
vez que se intente medir, lo más objetivamente posible, dicha incertidumbre. 


La inferencia estadística, en forma de estimación y docimasia de 
hipótesis sobre la base de resultados procedentes de la observación, cons: 
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tituye el problema fundamental en las relaciones entre la Estadística y 
las ciencias experimentales. Estas “quitan” y “ponen” a la realidad para 
la formación de modelos que, por una parte, reducen a esquemas simpli- 
ficados cúmulos de datos PS inabarcables y, por otra, tratan 
de hallar explicaciones plausibles y de predecir, extr: 'polando e interpo- 
lando, rellenando lagunas. El papel dí la Estadística aparece más clara- 
mente en las “metrías” (Econometría, Biometría, Sociometría, etc.). En 
todo caso podría decirse, abreviadamente, que el problema principal de la 
Estadística es el de sacar consecuencias de la ignorancia (inocencia) relativa 
o de la incertidumbre, ya que, como dice Lindley [15], nunca somos igno 
rantes en absoluto aunque sí podamos serlo prácticamente, como ocurre, 
por ejemplo, cuando la información disponible consiste en una sola 
observación. 

Sin entrar en una discusión detenida sobre los diversos procedimientos 
de enfrentarse con los problemas anteriores, indicaremos que como puede 
verse en textos de Estadística Matemática (como Kendall [16] o Crámer 
[9] ), tienen especial importancia los siguientes: 

a. El cálculo de una distribución de causas a posteriori partiendo de una distri 
hbución a priori, verdadera o supuesta 


b. La determinación de intervalos confidenciales o de confianza, + 
c. El establecimiento de una distribución fiducial 


Como es bien sabido, el primer método va ligado al nombre de Bayes, 
el segundo al de Neyman y Egon S. Pearson y el tercero al de R.A. Fisher. 
Según éste, hacia 1930 y, principalmente, como resultado de los trabajos 
de Gossett (“Student”), se empezaron a discutir los problemas estadísticos 
que parecían más dignos de estudio matemático riguroso, basándose en 
distribuciones probabilísticas exactas. La base lógica del correspondiente 
estudio de la significación de resultados era muy elemental y consistía en 
excluir, para un nivel de significación establecido de antemano, las hipó- 
tesis o suposiciones que sólo hubieran podido dar lugar a lo observado por 
coincidencias inverosímiles o poco plausibles. 

No se trataba, en general, de afirmaciones probabilísticas sobre el 
mundo real, como en el método de Bayes, sino de una medida racional y 
bien definida de nuestra aversión a aceptar la hipótesis en estudio. Breve- 
mente puede decirse que la fuerza en que se apoya tal conclusión es la 
lógica de la sencilla disyunción siguiente: o bien ha ocurrido un suceso 
cuya presentación es de rareza excepcional o bien no es cierta la teoría 
que presupone la llamada hipótesis nula. 


Sin intervención directa en la prolongada polémica sobre métodos de 
estimación, al medir la fiabilidad de los resultados en los diferentes proce- 
dimientos de muestreo probabilístico, se continuan empleando los inter- 
valos confidenciales, tal como se establecen en la teoría de Neyman-Pearson.? 


1 En el diseño de experimentos hay autores que siguen justificando el empleo de las 
distribuciones fiduciales, o bien explican como Bailey [2] que amo>oos modos, confidencial y fiducial 
son más propios, respectivamente, de la investigación científica o del desarrollo técnico. Es curioso 
que contrariamente, el Profesor Neyman haya dado el calificativo de estrategas a Wald y otros 
estadísticos de su escuela, autores de fundamentales avances en la teoría de la decisión, 


reservando 
el de técnicos para los fisherianos más estrictos 
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Es difícil negar la utilidad práctica de tales procedimientos, hoy usados 
en amplísima escala, pero no por eso conviene pasar por alto las críticas 
de Savage [30], entre las que se incluyen las referentes a la cadena infinita 
de estimaciones que supondría calcular errores de muestreo para los límites 
confidenciales, nuevos errores de muestreo para los anteriores y así 
sucesivamente. 

Anscombe [1] en sus comentarios sobre la obra de Savage, distingue 
dos tipos o situaciones de inferencia: 


l. El caso en que es razonable postular una clase de hipótesis simples “admisibles” 
(generalmente designadas por el valor de uno o varios parámetros) y afirmar que esta 
clase comprende la verdad, y 

2. Cuando lo que se considera es si alguna clase de hipótesis simple (lo que suele 
llamarse ahora hipótesis nula compuesta) comprende la verdad, cuando esta clase no 
esté contenida en otra más amplia de hipótesis admisibles bien definidas y establecidas 
de modo que contengan la verdad. En efecto, en el primer tipo de situación pueden 
utilizarse métodos bayesianos y la información contenida en las observaciones queda 
resumida por completo en la función de verosimilitud. La función de verosimilitud 
compara las hipótesis alternativas a la luz de las observaciones dadas, y las comparaciones 
se hacen en el espacio paramétrico, no en el espacio muestral. En el segundo tipo de 
situación lo que nos interesa es comparar las observaciones con lo que hubiera sido 
de esperar si la hipótesis nula fuese cierta; así las comparaciones se hacen en el espacio 
muestral y tenemos un ejemplo de “bondad del ajuste”. 


IV. EL CONCEPTO DE ALEATORIEDAD 


Aun en cuestiones aparentemente tan simples como es el muestreo 
aleatorio de poblaciones infinitas y que se tratan, en gran parte, en los 
textos de introducción a la Estadística Matemática, se pone de manifiesto 
la dificultad de establecer definiciones que sean a la vez rigurosas € 
intuitivas. 

En la discusión subsiguiente a un interesante trabajo de Neyman y 
Scott [26] sobre el método estadístico en problemas de cosmología, se 
suscita, una vez más, la cuestión de lo que puede o no considerarse como 
aleatorio. Como ya indica Cramér [9] y dice Barton en la mencionada 
discusión, un experimento tan típicamente aleatorio como el juego de 
dados puede considerarse desde un punto de vista determinístico empleando 
fórmulas de mecánica y dinámica de fluídos. Lo aleatorio se refiere pues 
a un cierto nivel de experiencia y puede desaparecer al cambiar éste. 
[.J. Good señala el uso de los llamados números pseudo-aleatorios, que 
se emplean, como si fueran de azar, en la resolución de los problemas por 
métodos de Monte Carlo, e incluso se recogen en tablas de números 
aleatorios, a pesar de haber sido obtenidos determinísticamente, con tal 
que pasen favorablemente cierto número de docimasias o tests de aleato- 
riedad (esto justificaría, en cierto modo, los discutidos procedimientos 
de validación de muestras, como prueba de su representatividad). 

Así cabría decir que el Universo o Cosmos pudiera ser pseudo-indeter- 
minístico, esto es determinístico, pero suficientemente complicado para no 
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aparecer como tal, al aplicarle una cierta batería de criterios.? Más con- 
cretamente Skellam opone la noción de conglomeración o agrupamiento 
a la de distribución uniforme u homogénea, tomando como ejemplo un 
bloque de granito de apariencia uniforme, que mirado de cerca deja ver 
cristales de cuarzo que destruyen la unitormidad, y más de cerca un retículo 
molecular uniforme y aun más cerca aparecería otra vez la irregularidad 
o aglomeración. 

Es, pues, posible que prácticamente no pueda mantenerse esta distin- 
ción, y haya de considerársela más bien metafísica. Neyman y Scott no 
creen que una actitud científica realista permita distinguir entre el inde- 
terminismo o aleatoriedad y el pseudo-indeterminismo y sugieren que la 


calificación de un fenómeno en uno u otro grupo depende del éxito en 
los métodos utilizados en su tratamiento. 


Las anteriores consideraciones deben tenerse en cuenta al establecer 
el diseño de muestreo más adecuado al estudio de poblaciones con carac- 
terísticas peculiares, muy especialmente cuando existan caminos diferentes 


para abordar la investig; ición, a los que corresponda distinta escala o nivel 
de experimentación. 


V. CONCLUSIONES 


Si parece evidente que la formación matemática y estadística del 
ciudadano medio, del profesional y del investigador en ciencias experi- 
mentales, deberá aumentar en extensión e intensidad durante los próximos 
años, el futuro del estadístico como profesión y aún de la Estadística Ma- 
temática como disciplina independiente están ligados a las tendencias que 
prevalezcan en los próximos años. Ya nos referimos anteriormente a la 
separación de los cultivadores de la Estadística en ciertos países, en dos 
grupos: el socio-político y el probabilista-matemático. Esto significó, en 
algunos casos, el abandono del campo estadístico en favor de aplicaciones 
como las físicas, metereológicas, económicas o de matemática pura. (Todo 
ésto independientemente de la clasificación de estadísticos o estadígrafos 
en recopiladores de datos, confeccionadores de cuadros numéricos, cal- 
culadores, diseñadores, profesores, investigadores, etc.) 

Hogben [14] ha expresado su desconfianza en lo que se refiere al 
futuro de la Estadística Matemática. Kendall [17] es más optimista en 
sus Opiniones. En todo caso, la cuestión del lugar que ocupa o debe ocupar 
el estadístico, en particular el técnico o universitario, no puede considerarse 
satisfactoriamente resuelto. Se discute aún si el estadístico propiamente 
dicho es básicamente un estratega o un táctico, un coordinador científico, 
un investigador operacional, un informador auxiliar o una especie de 
arúspice o profeta. 

En consecuencia, puesto que la preparación ideal para el estadístico 
es función del puesto que éste deba desempeñar, no está ya claro cual debe 

No debe confundirse este concepto con el de cripto-determinístico, término empleado por 


Whittaker, en el sentido de distribución probabilística que varía determinísticamente en el tiempo 
y que corresponde a la idea moderna de proceso estocástico 
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ser el programa de sus estudios y entrenamiento, ni si conviene la exis- 
tencia de departamentos o escuelas de Estadística inde pendientes o inter- 
facultativas, o si por el contrario deben situarse los cursos dentro de las 
Facultades de Ciencias, como una especialización más. Existen muchos 
artículos interesantes sobre estas cuestiones como los de Hotelling [15], 
Wold [10], Chapman [6], el antes mencionado de Kendall [171 y el titulado 
“La enseñanza de la Estadística al nivel universitario,” publicado en inglés 
con el título que se indica en la referencia [30]. 

Digamos para terminar que si una crítica de fundamentos y métodos 
es aún necesaria, no debe olvidarse que el exceso de perfeccionismo y la 
exageración de escrúpulos pueden llevar a la decadencia o la esterilidad, 
peligro que acecha a otras ramas aparentemente muy alejadas de la Esta- 
dística. El muestreo, puente entre la finitud de los recursos y la vida 
del hombre, y su ansia de conocimientos y necesidad de decidir, vendrá 
afectado por la evolución de la Estadística, y la solución de los problem: 1S 
que brevemente hemos comentado y el plante amiento de nuevas cuestiones. 
Pero la importancia de su aplicación y perfeccionamiento continuarán 
mientras se mantenga en rango preferente la investigación de la realidad. 
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PURPOSIVE AND STRATIFIED RANDOM 
SAMPLING TODAY 


FREDERICK F. STEPHAN, U.S.A. 
RESUMEN 


El estudio del Dr. Neyman pertenece a una serie de jalones 
dispuestos a lo largo del camino de la teoría y de la práctica 
modernas del muestreo. El progreso que se ha realizado hasta 
el presente incluve un desarrollo muy amplio de la teoría ma- 
temática del muestreo por métodos que implican selección alea 
toria. Aunque muchos problemas difíciles quedan por resolver, 
estamos bien equipados con la teoría para guiar la planificación 
y el análisis de este tipo de encuestas. Ha habido también mucha 
experiencia con los métodos de muestreo estratificado y se ha 
demostrado que ellos son utilísimos, aunque a menudo, puede 
obtenerse mayor ganancia mediante otras innovaciones en el 
procedimiento de muestreo. Sorprende el insignificante progreso 
habido hacia una teoría adecuada del muestreo dirigido y la 
prevalente opinión de los estadísticos matemáticos lo condena. 
Sin embargo es de uso común y existe mucha necesidad de un 
análisis definitivo que guíe aquellas de sus aplicaciones, que 
sean necesarias en el futuro. Finalmente, el problema de la 
optimización que fue tratado por el Dr. Neyman sobre una 
base limitada y desarrollado mucho más extensamente por otros 
desde que apareció su trabajo, todavía permanece más bien 
frustrado. Buenas soluciones para modelos más realistas parecen 
ser mejores que las mejores soluciones de los modelos indebida- 
mente idealizados. 


Professor Jerzy Neyman's paper is one of the landmarks in the 
development of modern sampling theory and practice. Statisticians should 
be grateful to him for preparing it and also to the Royal Statistical Society 
for providing the forum in which he presented it and for publishing a 
running account of the discussion which ensued. The discussion throws 
much light on the state of the art of sampling at the time, though of 
course it necessarily omits a great deal of pertinent information that would 
be useful in considering how much we have advanced since the evening 
when the paper, previously circulated to some members of the Society in 
proof, was presented in summary and discussed. Thereafter the publication 
of the paper stimulated many statisticians to approach the problem of 
sampling human populations with greater attention to the effectiveness 
of the sampling procedure in reducing sampling variation, avoiding bias, 
providing good estimates of the remaining risk of sampling error, and 
making the most advantageous allocation of the sample to the strata into 
which the population was divided. It was a major contribution to the 
development of a rigorous mathematical theory for sample surveys. 


* Professor of Social Statistics, Department of Economics and Sociology, 


Princeton University, 
New Jersey This paper was prepared in December 1959 
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We do not slight this landmark when we recognize several others, 
including Professor Bowley's report to the International Statistical 
Institute * nine years earlier, which provided a starting point for this paper, 
and the paper by Dr. Frank Yates and Mr. 1. Zacopany, ? which introduced 
explicit consideration of cost functions in the design of sampling procedures. 
While this latter paper was not concerned with sampling human popula- 
tions, it represented the very important development of sampling theory 
and practice in agricultural experimentation which since 1910 or even 
earlier had been building up the foundations of stratificd random sampling. 
Similar developments were ¡a in industrial statistics and, indeed, 
the Royal Statistical Society heard a very significant paper by Professor 
Egon Pearson * on industrial pad only a few. months before Professor 
Neyman's paper. The roots of modern sampling theory and practice 
spread out in many directions. 1 attempted to trace them in my historical 
paper in 1947.* It was Professor Neyman's great contribution to spur the 
progress of population sampling at a time when sampling in other branches 
of statistical inquiry was moving forward rapidly. 


The THEORY OF SAMPLING 


Where has this progress taken us? Where do we stand today ? First 
of all, the mathematical theory of those varieties of Sampling which are 
based on random selection has blossomed and borne magnificent fruit. 
A remarkable series of papers has appeared including such major contribu- 
tions, among many others, as the theory of sampling from finite populations 
with stratification, multistage sampling, and clusters by Mr. M.H. Hansen 
and Mr. W.N. Hurwitz* im 1943 and the monograph on large-scale 
sample surveys by Professor P.C. Mahalanobis * in 1944. Dr, Frank Yates * 
published his comprehensive book on sampling methods for censuses and 
surveys in 1949, Dr. W. Edwards Deming* his substantial book on some 
parts of the theory of sampling in 1950, Professor W.G. Cochran? his 
excellent account of sampling techniques in 1953, in the same year the 
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triumvirate of Mr. M.H. Hansen, Mr. W.N. Hurwitz and Dr. W.G. 
Madow * published their two volumes on sample survey methods and 
theory, and in the following year, Dr. P.V. Sukhatme 11 published his 
book on sampling theory of surveys. “Thus in five years statisticians were 
given a well developed theory for survey sampling with many ramifications 
provided to adapt it to various conditions that arise in practice. Moreover 
a large number of papers extending the body of theory have been published 
since this period. 

Great as this progress has becn, it by no means completes the task 
of forming the theory of sampling human populations. Many difficult 
problems remain to be solved. For example, the determination of the 
sampling errors of some results of the analysis of survey data presents 
difficulties. Nevertheless, we stand today admirably equipped with theory 
to guide the planning and analysis of surveys. 


STRATIFIED RANDOM SAMPLING 


Second, there has been a great deal of experience with stratified 
sampling methods. They have often worked well but sometimes they have 
become difficult or unwieldy or have produced only minor improvements 
in accuracy or small reductions of costs. Other procedures, such as selecting 
relatively large primary sampling units and then subsampling them have 
at times provided greater gains than stratification. Attempts to stratify 


a population on several variables simultaneously have encountered dif- 
ficulties. The necessity of weighting the data from each stratum separately 
has proven troublesome and made Professor Neyman's methods of allocating 
the sample to the strata less attractive. However the advent of electronic 
computing may remove this difficulty. In general, it would appear that 
stratified random sampling has proved useful in practice and will continue 
to be used widely although it may be overshadowed in importance by 
other developments in sampling procedure which have been brought forth 
since Professor Neyman's paper was published . 


PurPosIve METHODS 


Very little progress has been made toward an adequate theory of 
purposive sampling in the past 25 years. The prevailing opinion of 
mathematical statisticians is that purposive methods should be avoided 
since they do not involve random selection and are therefore biased and 
devoid of valid estimates of sampling error. However, in actual practice 
purposive methods or closely related methods are in common use. 
Professors F.F. Stephan and P.J. McCarthy ** compared so-called “quota 


14 Hansen, Morris, H., William N Hurwitz, and William G Madow, Sample 
Methods and Theory, New York, John Wilev XK Sons, two volumes, 638 
1 Sukhatme, P.V., Sampling Theory of Surveys with Atbppl 
Press, 1954 
Stephan, Frederick F., and Philip J McCarthy, Sampling Opinions, New York, John 
Wiley E Sons, 1958, 451 pp 
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sampling” and “probability sampling” in the field of opinion surveys and 
found the evidence not wholly conclusive as to the merits of each. 
Professors W.G. Cochran, F. Mosteller, and J. Tukey ** examined the 
sampling of the Kinsey Report which was not typically purposive but 
significantly related to purposive sampling. These and other studies have 
added to our knowledge about the actual practice of sampling methods 
which are not based on random selection but they leave open almost all 
the theoretical questions. We still ask, “Can purposive sampling be made 
more dependable by inventions and elaborations corresponding to those 
which have enhanced the effectiveness of random methods or is it 
inherently unsatisfactory ?” 

The importance of this question arises in part from the virtual impos- 
sibility of making strictly random selections under some circumstances 
In fact, Professor Neyman's evidence concerning purposive sampling was 
itself drawn not at random but from the readily available studies provided 
by a single trial in only one country under some not wholly typical 
conditions. All of us are compelled to make generalizations from data 
which do not arise from random selection. While these instances do not 
conform to the particular concept of purposive sampling used by Professor 
Neyman, they are members of a wider class of non-random selections 
which we can h: wdly ignore. There is need for a further development of 
theory and improved procedures relating to this general class of data- 
generating processes. In this sphere the problems appear not so readily 
amenable to solution by means of mathematical models but this may only 
be due to our myopia or inadequate motivation. Dr. Frank Yates, ** in 
his study of balanced samples, and Mr. Roe Goodman and Dr. Leslie 


Kish, 1% in their study of controlled sampling, have shown that much more 
can be done. 


OPTIMIZATION 


In Professor Neyman's paper the sample was allocated to the several 
strata in proportions which were calculated from the mathematical models 
to provide the least possible sampling error variance. He gave some 
consideration also to the size of sampling units but did not develop an 
optimizing process for this phase of survey design. This has since been 
done by Dr. Tore Dalenius.** There are many other aspects which have 
come to be considered, including “non-sampling errors” and “errors of 
application.” It has become increasingly evident that the improvement of 
survey designs demands a faily complicated balancing of considerations 
and what may be optimal in the limited context of a specific set of plans 


Cochran, William G., Frederick Mosteller, and John W. Tukey, Statistical Problems of 


the Kinsey Report on Sexual Behavior in the Human Male, Washington, The American Statistical 
Association, 1954, 338 pp. 


14 Yates, of. cit 
Goodman, Roe, and Leslie Kish, “Controlled selection—a techniaue in probabilitvy sampling.” 
Journal of the American Statistical Association, Vol. 45 (1950), pp. 350-372 


14 Dalenius, Tore, “The problem of optimal stratification,” Skandinavisk Aktuarietidskrift, 
1950, pp. 203-213; 1951, pp. 133-148 (with Margaret Gurney); 1952, pp. 61-70, 
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may be substantially less than optimal under alternative sets of plans. 
Fhus, for example, a reduction in sample size may permit better training 
of interviewers and consequent improvement in the accuracy of the final 
analyses. The problems of optimization on this broader scale are baffling 
and many statisticians will be glad to accept quite approximate solutions, 
asking only that they be very good, not that they be best. 


The same considerations place sampling bias in a different light. 
Since other biases are certainly present the attainment of results completely 
free from sampling bias appears to be practically unimportant. What 
matters most is the mean square deviation from a suitably defined “true 
value” or some similar measure of the suitability of the probability 
distribution of final results for the purposes for which they will be used. 
The optimal solution for varicus mathematical models may be quite useful 
guides for action in this greatly expanded problem of sample survey design 
even though they do not in any real sense provide precise answers to 
“what is best?” Similar conclusions about unduly idealized models and 
limited optimization occur in operations research and other fields. In 
spite of this revision of our expectations from mathematical theory, it will 
continue to find new applications. The further development of the theory 
of sampling, in which Professor Neyman's paper marks one of the 
milestones, is greatly to be desired. 





ESTADISTICAS Y PARAMETROS 


CarLos E. DIEULEFArr, Argentina * 
SUMMARY 


In this article the author deals with the different positions 
assumed by mathematicians with regard to the fundamental 
problem of the estimation of parameters. After taking up 
Gauss's idea—the principle of the arithmetic mean and the 
hypothesis of a constant value for the a priori probability of the 
true mean—he recalls the valuable contribution made by Fisher. 
The position of the Bayes-Laplace formula in the elucidation 
of this important problems is then pointed out. 

The writer next expresses his opinion, in contradiction to 
that of Professor Fortet, regarding the results obtained by use 
of the Bayes-Laplace formula and estimation methods that are 
independent of this formula. He summarizes the results of von 
Mises” investigations based on the Bayes-Laplace formula and 
draws the reader's attention to an error of appraisal in von 
Mises” evaluation of the contribution made by Laplace to the 
improvement of the formula. 


The article concludes with a critical reference to the point 
of view of J. Neyman. 


El problema de la estimación de los parámetros ha suscitado siempre, 
entre los matemáticos, graves divergencias y, más que dos escuelas diferen- 
tes; lo que hay en ese sentido, es una variedad infinita de opiniones. 

Las opiniones opuestas, a veces vivamente expresadas, vienen de lejos. 
El procedimiento seguido por Gauss, por ejemplo, ya en 1809, para dar 
con la ley de distribución de los errores de observación, fue uno de los 
primeros y más conocidos motivos de discusión. 

En habiéndose obtenido n medidas de una magnitud cuyo valor ver- 
dadero era desconocido, Gauss siguió el camino ortodoxo de las probabili- 
dades a posteriori, utilizando para ello la fórmula de Bayes. Supuso enton- 
ces que la probabilidad a priori, correspondiente a la medida verdadera, 
era constante y se dijo que la probabilidad a posteriori debía alcanzar 
su valor máximo para un valor de la magnitud verdadera que se encontrase 
dentro del intervalo de las medidas observadas. 

Esa última condición se verifica si se toma como expresión de la 
magnitud verdadera a la media aritmética de las observaciones de modo 
que, en esta forma, obtenía la formación de un doble compromiso. 

Si se reflexiona un poco sobre este punto, se echa de ver que la 
segunda parte del compromiso, que constituye el principio de la media 
aritmética, se ha debido incorporar al razonamiento por cuanto se ignora 
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y se debe determinar la ley de distribución de los errores. De este modo, 
la diferencia entre el procedimiento de Gauss y el método de máxima 
verosimilitud depende de las diferencias frente al problema de la especifi- 
cación de la función de distribución, siendo en el resto completamente 
iguales. 

El antecedente de las ideas de Fisher, dado en Gauss, lo menciona 
de paso el profesor H. Cramér [3] al referirse a la teoría desarrollada perso- 
nalmente por el profesor Fisher al crear una importante álgebra en el 
problema de la estimación de los parámetros mediante la elaboración de 
los conceptos fundamentales de consistencia, eficiencia, suficiencia y can- 
tidad de información. Si sobre esta última entidad ha faltado un general 
acuerdo y el profesor N. Wiener en su Cybernética ha sugerido otra forma, 
no queda duda alguna de que Fisher ha realizado, en la teoría de la esti- 
mación y también en el último punto, una singular y penetrante obra 
de pionero. 

Volviendo a nuestra referencia acerca del razonamiento de Gauss, es 
importante observar, como lo señaló el profesor G. Castelnuovo en su 
libro [1], cuya primera edición es de 1919, que el postulado de la media 
aritmética y la hipótesis de que la probabilidad es constante, no son inde- 
pendientes o, más precisamente, que el primer principio hace necesaria 
la aludida hipótesis. 

Esa observación puede repetirse en el caso corriente de la estimación 
de un parámetro, ensanchando la fórmula de Bayes, como lo hizo cierta- 
mente Laplace, mediante la introducción de las probabilidades a priori. 
Con notación cuya significación es inmediata, la probabilidad a posteriori 
para que el parámetro desconocido tenga un valor € estará dada por: 


U(0) = C-p(0) 1j (2, 0) 
1 


Pasando a derivadas logarítmicas respecto al parámetro se encuentra 
que la probabilidad a priori p (6) debe ser constante cuando se requiere 
que la probabilidad a posteriori sea un máximo y se aplica, simultánea- 
mente, el principio de máxima verosimilitud. 

En esas condiciones, la fórmula de Bayes-Laplace es un paso conceptual 
intermedio que podrá prácticamente omitirse para plantear el problema 
de la estimación partiendo, directamente, de la función de verosimilitud 
y estimar el parámetro desconocido con la maximización de dicha función . 

Ahora bien, la eliminación de las probabilidades a priori puede ha- 
cerse legítimamente, y aún en el caso de suponer que no son constantes, 
cuando en la fórmula de Bayes-Laplace se hace crecer a n indefinidamente. 

En tal situación, la probabilidad a posteriori será independiente de 
las probabilidades a priori, del mismo modo que la colocación final de 
una bolilla en la ruleta, será independiente de su posición inicial si la 
velocidad inicial es suficientemente grande. 

El lector reconocerá aquí, para el caso n infinito, una analogía entre 
el resultado de la fórmula de Bayes-Laplace y el de las funciones arbitra- 
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rias introducidas por H. Poincaré. Es una analogía que conviene consi- 
derar especialmente en el caso de pequeñas muestras, ya que la posición 
final de la bolilla no será independiente de la velocidad inicial, cuando 
ésta sea pequeña, lo mismo que la probabilidad a posteriori no podrá 
prescindir de la probabilidad a priori si el tamaño de la muestra es 
reducido. 

Hace poco que el profesor Khintchine [6] ha adoptado, como principio 
para fundar una nueva concepción de la probabilidad, a las funciones 
arbitrarias, creyendo ver en las que se conoce, pecados idealistas. Al refe- 
rirse a la teoría de R. von Mises que, según él, no cuenta ningún gran 
especialista actual entre sus adeptos, deduce que las probabilidades defi- 
nidas por von Mises [8] no son engendradas por las particularidades intrínse- 
cas de los fenómenos, sino por nuestra experiencia. 


Con pesar debe reconocerse que el fondo lógico de los problemas de 


estimación, como el mismo concepto de probabilidad, motiven, todavía, 
puntos de vistas tan opuestos. 


II. 


Una elocuente evidencia de cuán profundas son las diferencias seña- 
ladas, la podrá encontrar el lector en el informe del profesor M. Fréchet [5] 
encargado de presentar en las conferencias internacionales de Estadística 
de 1947, los resultados de una encuesta sobre la estimación que realizara 


por cuenta del Instituto Internacional de Estadística. 

En ese notable documento, el profesor Fortet expresa la opinión de 
que los métodos de estimación independientes de la fórmula de Bayes- 
Laplace, dan, asintóticamente, los mismos resultados que los de esa fórmula. 

Aparente y prácticamente, puede suponerse que es así, pero real y 
críticamente, no. Los resultados finales son, conceptualmente, por com- 
pleto opuestos entre sí. En la línea del razonamiento de Bayes-Laplace 
es el parámetro, desconocido, el que se distribuirá normalmente alrededor 
del centro dado por la estadística que lo estima. En cambio, en el otro 
caso, son las estadísticas las que se distribuirán mormalmente alrededor 
del centro dado por el parámetro desconocido. 

En el primer caso se está manteniendo la filosofía de que el parámetro 
debe ajustarse al límite de nuestro conocimiento derivado de la experien- 
cia, en tanto que en la otra posición se está utilizando una tésis según 
la cual el valor límite de nuestra experiencia debe ajustarse al parámetro 
desconocido. Esta última versión debe sólo admitirse en la medida que 
se estudien resultados límites de las distribuciones de las estadísticas, par- 
tiendo de muestras derivadas de una población conocida, lo que pertenece 
al dominio del Cálculo de Probabilidades pero nunca a la cuestión del 
verdadero problema estadístico de la estimación. 

Vale la pena precisar este punto, especialmente cuando en el mismo 


intervienen, de un modo decisivo, recursos analíticos suministrados por 
el mismo Laplace. 
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El profesor R. von Mises ha estudiado largamente el problema de la 
estimación con el recurso de la fórmula de Bayes-Laplace, si bien, inexpti- 
cablemente, lo mismo que por lo demás hará el profesor R.A. Fisher, 
da por sentado que Laplace no incorporó a esa fórmula clásica las proba- 
bilidades a priori que Bayes si omitió en su célebre ensayo. Por fortuna, 
para salvar esta inadvertencia, siempre podrá consultarse con provecho 
el inmortal Tomo VII de la Teoría Analítica de las Probabilidades en las 
Oeuvres de Laplace. 


El conocido método del cuello que el físico inglés Fowler generalizara 
al campo complejo no hay duda alguna que se debe, esencialmente, a 
Laplace. Puede el lector remitirse al libro de ejercicios de análisis de los 
profesores Polya y Szego [7] para completar los resultados de von Mises que 
aquí resumiremos con el exclusivo apoyo y recurso mencionado. 


Se tiene así, con notación evidente: 


"» 
P(0<0<9/M,) = cf P(0) P(M,/0) do 


La anterior fórmula de Bayes-Laplace, en casos determinados, no puede 
suscitar ninguna oposición fundada. En nuestro “Curso de Estadística” 
publicado por la Revista Brasileira de Estatística, hemos expuesto tres 


ejercicios ilustrativos: uno de J. Neyman y los otros dos de Fry y 


de 
von Mises 


Siendo 6, el valor de 6 para el cual P (M,/0) es máximo, se tiene: 


P(M,/0) = Mf(x,, 0 
1 


» (6 0,2 d? lo P(M/¡0 
log PMA) y 


2 d6? 


Luego: 


n(0 — Om 2 ¿2 log P(Mn/0") 


P(0<0<08/M) =C P()ce. 2 ndR  d6 
: 
con 6” interior al intervalo de integración . 


Además se tiene: 


di log P(M,/0) si df (x;,0) NN E k2 (0) 
n de? 5 dg $ (x;,0) 


him 
n +00 

00 
con una probabilidad que tiende a la unidad con n > x. Es interesante 
observar que este límite puede ser demostrado, independientemente de 
las formas corrientes, con los razonamientos puestos en juego por Bolzman 
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en sus estudios del equilibrio estacionario, en el que interviene además, 
desde luego que sin esa denominación, el concepto del x?, el de sus grados 
de libertad, tan largamente discutidos y el de su ley de distribución, con- 
forme puede verse en el ya mencionado libro de G. Castelnuovo. La 
estadística Xx? que constituye el tema fundamental de la célebre memoria 
de K. Pearson de 1900 no apareció allí con su verdadera “raison d'étre” 
como lo precisó W.G. Cochran [2], en su estudio de 1952 al decir: “One 
misses any discussion of how Pearson came to choose the X 


test 
criterion,...” 


Siendo: 4 < 0, < 0, de las relaciones anteriores resulta: 


: * _ 106 
P_ y — , 2/m k2(06n) d0 


vV21 /Vn k(0,) 


P = lim P(0<06<0/M,) 
n><+w 
Se ve cómo las P (9) dejan de importar para n infinito y cómo es € quien 
se distribuye alrededor de la estadística en su movimiento asintótico. 


A esta altura, después de tremendas omisiones al problema de la 
estimación y reducciones drásticas de nuestra misma exposición, séanos 
permitido referirnos a la teoría del profesor J. Neyman, de los intervalos 
de confianza, cuya versión traducida se da en este número de la Revista. 

Si no he interpretado mal algunos de sus escritos, Neyman, en prin- 
cipio, es ferviente defensor de un mantenimiento del método deductivo 
en donde otros han creído realizar razonamientos inductivos. Convendrá 
tener en cuenta esta forma de pensar básica, ya que la teoría de los inter- 
valos de confianza está impregnada de este punto de vista. 

Como el lector podrá verificar directamente el dominio que Neyman 
llama cinturón de confianza lo forma, en su memoria, con la intervención 
de la probabilidad a priori (6) que versiones posteriores de otros autores 
se esforzarán en omitir. 

Neyman intentó, con su trabajo, dar una explicación de las ideas de 
Fisher pero con el resultado de que este último autor se declarara insa- 
tisfecho de ese intento. En rigor pues, la teoría de Neyman es una indis- 
cutida creación original de este autor, mediante la cual crea el conjunto 
de los intervalos de confianza correspondiente a un determinado coefi- 
ciente de confianza. Nada nos dice, directamente, de lo que puede ocurrir 
entre el intervalo de confianza que se construya con los elementos de una 
muestra realizada, en relación con el parámetro desconocido, del mismo 
modo como no se puede decir cuál es la probabilidad para que Juan Smith, 
de 35 años, viva un año más. 
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Desde el punto de vista práctico, del querer saber algo del parámetro 
con la evidencia de una muestra realizada, el método de Neyman no da 
respuesta alguna. La teoría de Neyman se desarrolla y da sus conclusiones 
en el lenguaje clásico y directo del Cálculo de las Probabilidades, conse- 
cuente con el principio deductivista de su autor. 

Ahora bien, tiene una importancia muy grande, en nuestra opinión, 
el hecho de que la teoría de los intervalos de confianza de Neyman se 
elabore precisamente frente a la preocupación de este autor por los pro- 
blemas de muestreo. 

Respecto a este punto es sobre el que deseamos hacer una observa ión 
final. Es posible pensar en operaciones de muestreo de carácter ocasional 
y esporádico y ello es diferente a pensar en la institución del muestreo 
como una sucesión de operaciones. En una interpretación de frec uencias 
se puede decir entonces cuál será la frecuencia de conclusiones correctas 
al utilizar los diagnósticos de los intervalos de confianza en el recubrimien- 
to del parámetro desconocido. 

La separación entre la teoría de los intervalos de confianza y su utili- 
zación práctica irá gradualmente aminorándose en la medida como se esta- 
blezcan, en la práctica de las operaciones estadísticas, los procedimientos 
de muestreo, encarados como una nueva institución estadística y no como 
una aventura esporádica. 
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LA THÉORIE DE L'ESTIMATION ET LES 
SONDAGES 


“TH1ONET, France * 


RESUMEN 


La teoría de las encuestas por muestreo y la de la estimación 
estadística se han desarrollado cada una por su lado; la 
de la estimación tiene dos escuelas: la de R.A. Fisher 
que, con Neyman y Wald, 


teoría 
y aquella 
ha retomado el concepto de Bayes. 
por el cual lo que se estima no es un cierto número desconocido 
sino un número aleatorio. Basu, Godambe, Kitagawa, Murthy. 
y también el autor, han trabajado en una teoría de la estimación 
de las muestras que no forma parte de ninguna escuela. El autor 
hace una pregunta para saber si es posible mezclar probabilida 
des objetivas y subjetivas. 

1 propósito de la investigación del mejor estimador inses 
gado, el autor propone un perfeccionamiento al concepto actual 
de restricción. Da el resultado de Hájek en las formas canónicas. 
Después recuerda las controversias suscitadas por Midzuno y 
terminadas (espera) por Murthy. El autor presenta ejemplos 
de estimadores insesgados con informaciones suplementarias, es- 
pecialmente del tipo razón; y formula ciertas reservas. Cuando 
se refiere al caso en que se hacen hipótesis de estructura, cita 
a Hájek y Des Raj. Evoca rápidamente el problema de la 
estimación de las varianzas y covarianzas. Después se extiende 
un poco sobre el caso de los estimadores sesgados, muy empleados 
pero cuya teoría es insuficiente. El autor expone su propia 
teoria. 

Si se llega hasta especificar la ley de distribución, se halla 
la estimación de Fisher (máximo de verosimilitud). Si se espe- 
cifica una ley de probabilidad a priori, se halla la estimación 
de Bayes cuya aplicación práctica al muestreo suscita reservas; 
pero es conceptualmente satisfactorio saber que partiendo de 
leyes normales (y de otras más generales) los estimadores de las 
muestras constituyen un óptimo. 


INTRODUCTION 


La Théorie des Sondages prend en 1934, avec 
nouveau tournant. 


Jerzy Neyman un 
Cependant, en matiére d'estimation, la nouvelle théoric 
des sondages ne bénéficie que trés rarement des progres de la Statistique 
Mathématique c'está-dire de Pestimation du maximum de vraisemblance 
de Sir Ronald Fisher, dont Pextension á plusieurs paramétres par Doob 
et Dugué date de la méme époque. A vrai dire, les objectifs de Fishen 
et de Neyman ne different guére: obtenir les estimateurs sans biais (ou 
de biais négligeable) dont la variance soit minimum (pour tout échantil. 
lon ou á la limite quand lVéchantillon devient assez grand). Mais ce sont 
les conditions du probleme (plus que les buts) qui sont en opposition: 
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Fisher a affaire á des données dont ¿l suppose qu'on pourrait les obten 
par des tirages de boules dans Purne de Bernoulli: dams le cadre de 
recherches expérimentales systématiques, il peut admettre qu'il a affaire 
á des familles de populations dont les distributions ont la méme forme 
connue et ne diflérent entre elles que par les valeurs numériques de 
quelques paramétres. Au contraire, quand Neyman traite de sondage dans 
un recensement polonais, il sait cette fois trés bien par quel tirage au sort 
est précisément obtenu son échantillon; mais il ne connaít pas du tout 
la forme théorique des distributions aimsi sondées, et peut-étre pense-t-il 
(comme nous) qu'elles n'épousent aucune forme théorique. 

Il semble donc bien que Neyman ait abordé le probléme de Vestima- 
tion dans les enquétes par sondage d'une facon saine; et d'ailleurs ne 
commence-t-1 pas son exposé par un théoréme du grand mathématicien 
russe Markov. Un article récent de Zarcovié [1] donnerait á penser que 
les probabilistes russes connaissaient déja tout cela, mais il nous laisse 
sceptique; car le point précis qu'on peut vérifier sans lire le russe concerne 
les articles de Tschuprow dans Metron, édité a Rome: or le seul article 
sur les sondages est de Bowley. 

Depuis 1934, la théorie e des plans d'enquéte par sondage 
s'est largement développée. Cependant, si Neyman y apporte une contribu- 
tion importante [2] le centre de son intérét se dépl: ice vers les jugements 
sur échantillon (en collaboration avec Egon Pearson). De lá est née 
ensuite, avec Abraham Wald (mort en 1950), une “nouvelle” théorie de 
lVestimation. La théorie du maximum de vraisemblance a été soumise á 
critiques, contestée, avant d'étre reconnue comme partie intégrante, voire 
piece maítresse du nouvel édifice. 

Dans ces aftaires—d'oú la sérénité et Pobjectivité scientifique étaient 
partois absentes—empressons-nous de dire que la théorie des enquétes par 
sondage n'était pas en cause. 

Cependant le caractére un peu “décousu” des travaux “théoriques” 
sur les sondages—dú souvent aux besoins pratiques terre-á-terre qui les 
faisaient naitre—n'a pas échappé aux mathématiciens, malgré les nombreaux 
traités et manuels parus sur les sondages depuis 1946. C'est en Inde que 
nous observons d'abord des exigences logiques et des soucis, qui ne se 
limitent plus á á apprendre á écrire correctement divers estimateurs com- 
pliqués, ni méme á les écrire de facon particulierement esthétique. 

Nous avons ainsi noté, dans Sankhya (The Indian Journal of Statis- 
tics) deux articles essentiels de D. Basu: “On symmetric estimators in point 
estimation with convex weight function” [3]; “On the optimum character 
of some estimators used in multistage sampling problems” [4]. 

Basu indique d'ailleurs qu'une partie de ses résultats de 1952 est 
déja dans Basu (1938), C.R. Rao (1952), Halmos (1946). Un autre Rao 
(S. Raja Rao) a trouvé certains des résultats de 1954. 


L"objet de ces articles est de faire ressortir le caractére optimal (a 
lPintéricur d'une classe tres large) des estimateurs sans biais utilisés pour 
les sondages (notons en passant que Vemploi d'estimateurs symétriques, 
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par exemple, est admis comme une nécessité qui va de soi, dans les ouvrages 
ayant un but pratique, comme le Calcul des Probabilités de R. Fortet 
(1950). 

Un autre théorie trés intéressante a été développée par le japonais 
Kitagawa [5] avec ses processus d'inférence statistique, inspirés par l'analyse 
séquentielle de Wald. 

Nous avons également noté Particle de V.P. Godambe [6] qui a 
le grand mérite d'englober certains estimateurs biaisés (et surtout l'estima- 
ticn par ratio) et d'introduire les probabilités subjectives a priori. Enfin 
Particle de Murthy [7] dont nous reparlerons, revient sur les mérites des 
estimateurs symétriques, indépendants de Vordre dans lequel sont sorties 
les unités composant l'échantillon. 

L'auteur du présent article a lui-méme construit une théorie de 
Pestimation pour les enquétes par sondage, oú la notion d'erreur de 
sondage céde la place á celle, plus large, de perte d'information par 
sondage [8]. Basu et nous-méme avons subi influence de Wald. Cependant 
rien ne nous oblige á opter pour la conception de l'estimation qui exige 
que le paramétre á estimer soit une variable aléatoire dont on se donne 
la loi de probabilité a priori (si Pon veut, la conception “Bayesienne” ou 
“anti-Fisherienne” de Pestimation). 

L'auteur n'est pas trés á Paise á Pidée de mélanger dans un méme 
calcul les probabilités subjectives attribuées a priori au dit estimé, les 
hypotheses arbitraires concernant les distributions au sein desquelles on 


sonde, et les probabilités afférentes a Vestimateur, lesquelles sont tout 
ce qu'il y a d'objectives puisque Véchantillon provient de véritables tirages 
au sort. 11 comprend d'ailleurs tres bien que, pour des estimations a 
partir de données, assimilées a un échantillon tiré de Purne de Bernoulli 
mais obtenues en fait tout autrement, on n'ait plus les mémes scrupules, 
puisqu'on ne manie plus en définitive que des probabilités subjectives. 


On va á présent examiner successivement les estimations sans biais des 
enquétes par sondage, le cas des informations supplémentaires, les hypo- 
theses de structure, les estimateurs biaisés, les populations entiérement 
spécifiées, les distributions de probabilités a priori. 


Z RECHERCHE DU MEILLEUR ESTIMATEUR LINÉAIRE NON-BIAISÉ 


A la suite de Neyman, on s'est particulicerement attaché á construire 
des estimateurs jouissant des critéres suivants: (1) absence de biais, (2) 
variance minimum, á l'intérieur d'une certaine classe d'estimateurs auxquels 
sont imposés les restrictions propres á toute oecuvre humaine: les liaisons 
(comme on dit en mécanique); et, comme il s'agit toujours d'estimer la 
valeur totale ou la valeur moyenne prise par une variable X sur les unités 
composant la population, on ne cherche guére d'autre estimateur qu'une 
certaine combinaison linéaire des valeurs-échantillons de X. 

Ciest ce que les anglo-saxons désignent par “blue” (best limear 
unbiased estimation) c'est-á-dire littéralement: meilleur estimation lincaire 
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sans biais. Le critere d'optimalité retenu est donc que la variance (de 
Vestimation) prenne la valeur minimum compatible avec les liaisons. 

Les liaisons. Neyman avait imposé á son estimateur (d'une population 
stratifiée) une liaison trés simple: il supposait que Peffectif total de 
léchantillon était donné. C'est Yates (1935) qui introduisit Phypothése 
d'un coút moyen différent d'une strate a Pautre et lia Pestimateur par la 
condition du coút total constant. Neyman fit sienne cette conception 
(1938). 

Pour les sondages á plusieurs degrés, les divers auteurs (par exemple 
Thionet [9]) ont admis, pour simplifier, qu'on ne maintenait plus constant 
ni Peffectif de Péchantillon, ni le coút du sondage, mais bien P'espérance 
mathématique de cet effectif ou de ce coút devenu aléatorre. 

Finalement il s'agit toujours de rendre minimum une PT fonction 
V> (pj) de parametres p, liés par une condition € (pj) = 0, probleme 
classique V'extremum lié qu'on résout en introduisant une Bd sup 
plémentaire 1 . appelée multiplicateur de Lagrange. On ne semble guére 
avoir eu jusqu'ici Poccasion d'imposer aux f, simultanément plusieurs 
conditions C;= 0, et par conséquent de faire intervenir plusieurs multi- 
plicateurs de Lagrange £;; cependant nous avons signalé dans la Revue 
de l'Institut International de Statistique (Thionet, 1954) [10] qu'en France 
(et vraisemblablement ailleurs) la liaison á la Neyman-Yates n'était pas 
tres réaliste. Une enquéte par sondage publique nécessite la mise en 
oeuvre de moyens divers en personnel, matériel, crédits, qui ne sont pas 
du tout intercheangeables; méme si c'est finalement la puissance publique 
qui finance en totalité Penquéte (ce qui n'est pas forcément le cas, puisque 
bien des sondages sont d'intérét mixte, á la fois public et privé), il n'est 
pas du tout indifférent de savoir que les enquéteurs sont pour partie des 
employés á temps complet des offices locaux de statistique, et pour partie 
du personnel occasionnel payé en fonction du nombre de questionnaires 
remplis. Et méme lorsque les frais de voyage des enquéteurs du premier 
type et le salaire des enquéteurs du deuxiéme type sont payés par la méme 
Caisse publique, il s'agit de deux opérations comptables distinctes, pour 
lesquelles un Budget sain prévoit des yan sur des Crédits distincts. 

C'est pourquoi nous pensons que la théorie des sondages doit prévoin 
la maximisation d'une expression de la forme 


V (p) + L,C, + L>C, + L3C3 = F(p;, L) 


11 faut d'ailleurs ajouter, pour étre complet, que, si les ressources dont 
dispose le statisticien pour son enquéte sont toutes limitées, il n'est pas 
prouvé qu'on doive épuiser la totalité de ces ressources pour atteindre le 
minimum de Y (p;). Les conditions réellement imposées sont de la forme 

(pj) 0; le signe “inférieur a” est remplacé par le signe “égal a” quand 
le type 7 de ressource est épuisé. 

Par exemple supposons que la variance Y soit la somme de termes 
distincts provenant de strates distinctes; et considérons trois types distincts 
de ressources: ¿= 1, les crédits pour frais de mission et de déplacements, 
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utilisés seulement dans les strates de catégorie 1; ¿ = 2, les ressources en 
personnel permanent, utilisés seulement dans les strates de catégories 2 et 
l; 3 = 3, les crédits destinés á payer les enquéteurs supplémentaires, 
travaillant seulement dans les strates de catégorie 3. Il est facile de com- 
prendre qu'on réduit la variance Y en utilisant jusqu'a épuisement les 
crédits C¿. En revanche on peut calculer la répartition optimum des 
ressources C, entre les strates de catégories 2 et 1, c'est-á-dire calculer les 
frais de mission et de déplacement de ce personnel quand il opére en 
dehors de la ville oú il habite (c'est ce que nous appelons strates de 
catégorie 1). 11 est bien clair que: 
1. Ou bien les crédits C, sont trop larges et ne seront pas épuisés; 


2. Ou bien ces crédits sont trop justes, constituent un goulot d'étranglement, 


> 
obligent le statisticien á réduire les enquétes en catégorie 1 au profit de la catégorie 
de strates 2—bref aboutissent á une répartition des ressources constituant un “optimum”” 
lié fort différent du précédent; 

3. Ou bien, en fin, ces crédits C, avaient été par miracle calculés au plus juste 
permettent la répartition-optimum des ressources C. et se trouvent alors totalement 
utilisés. 


Il Sagit lá de notions bien connues d'économétrie, dont Pannexion 
par la théorie des sondages pourrait avoir quelque succes. 


Les formes canoniques. Nous tenons á signaler á présent la trés remar- 
quable contribution du mathématicien tchéque J. Hájek [11] qui a montré 


que l'optimum á la Neyman-Yates se ramenait, dans un trés grand nombre 
de cas, á une formulation commune, appeléc canonique par Hájek. 

La variance est homogéne de degré —1 par rapport aux paramétres 
Pi, tandis que le coút est linéaire en p;. Alors le rapport des dérivées 
partielles de Y et de € (autrement dit le multiplicateur de Lagrange L£) 
se trouve justement égal a V/(C—C,). 

On trouve le méme résultat si on écrit que le produit V(C—C,) 
de la variance par le coút (amputé de sa partie fixe) est constant. Et 
cette propriété était en fait déja utiliséc (par exemple par Sukhatme dans 
son traité [12])). 


3. RECHERCHE D'UN ESTIMATEUR SANS BIAIS 
LORSQU'INTERVIENNENT DES PROBABILITÉS LIÉES 


Le calcul de Pespérance mathématique d'un estimateur d'apres un 
plan de sondage donné devient délicat, lorsque chaque tirage d'une unité- 
échantillon modifie la distribution de probabilités pour le tirage des unités 
suivantes. Lorsqu'il s'agit de tirages équiprobables, analogues a Vextraction 
“sans remise” de boules d'une urne, la difficulté est classique; la distribu- 
tion “hyper-géométrique” de probabilité a des propriétés remarquablement 
simples; et qu'il y ait ou non “remise dans Purne,” les formules se res- 
semblent beaucoup. 

En revanche les tirages sans remise avec probabilités inégales ont posé 
une véritable énigme—du moins pour les mathématiciens car en pratique 
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le comportement légerement incorrect des statisticiens n'a probablement 
jamais déformé beaucoup les échantillons: Le statisticien tire ses villes- 
echantillons sans remise, mais faute de mieux il emploie les formules du 
cas avec remise. 11 Sensuit que les plus grandes villes d'une strate sont 
un peu plus rares qu'il ne faudrait dans lPéchantillon; á peine est-ce 
sensible. 

Nous ne saurions reprendre ici les articles de Midzuno (1950), de 
Horvitz et Thompson [13] qui fit connaítre Midzuno en France (et nous 
fournit des sujets de probléme et d'exercice á Pusage des étudiants); puis 
les articles assez durs de Yates et Grundy [14], d'une part, de Durbin [15], 
de Pautre; puis la communication de Singh et Saxena á Rio-de- Janeiro 116] 
oú il est question d'une these de Sen (1952) et d'un article de Singh (1954); 
enfin Varticle de Murthy [7] qui remet Midzuno, Horvitz et Thompson 
a la place d'honneur., 

Il y a certainement chez Murthy des remarques trés profondes, qui 
touchent á Pessence du probléme: on peut construire bien des estimateurs 
sans biais, qui dépendent de Pordre de tirage des unité-échantillons; leur 
probabilité est la probabilité de tirer d'abord ¡ puis 7 sachant qu'on vient 
de tirer. ... Mais tous ces estimateurs ont une espérance mathématique 
indépendante de Pordre de tirage, et C'est Pestimateur de variance mini- 
mum. On retrouve justement la solution de Horvitz et Thompson. 

Signalons d'ailleurs que Stevens (professeur a Sáo Paulo) [17] a imaginé 
un moyen trés élégant de conserver P'estimateur sans biais des tirages avec 
remise: lorsqu'il arrive qu'une unité de sondage soit tirée 2 fois, il la 
remplace la deuxiéme fois par une unité ayant la méme probabilité de 
sortie (ce qui conduit á un léger changement de variance); mais ceci sort 
du cadre de notre exposé , 


4.  FESTIMATION SANS BIAIS 
UTILISANT DES INFORMATIONS SUPPLÉMENTAIRES 


Afin de ne plus nous préoccuper du choix du plan de sondage, nous 
nous en tiendrons ¿ un échantillon “bernoullien” tiré avec d'égales pro- 
babilités et avec remise. 

Alors, si Pon posséede certaines informations supplémentaires sur la 
population sondée, on sait construire des estimateurs “meilleurs” que la 
banale moyenne arithmétique simple des données. Commencons par les 
estimateurs sans biais: il s'agit que leur variance soit inféricure ¿ 0?2/n, o 
étant Pécart-type de la population sondée et n étant la taille de Véch: antif 
lon. Nous examinerons quelques cas intéressants ayant fait Pobjet de 
recherches récentes, sans prétendre n'en pas oublier 


Cas oú les unités de sondage sont identifiables. 


Supposons que, bien qu'on remette dans Purne Pune aprés Vautre 
chaque boule tirée, on soit capable de s'apercevoir qu'on a tiré plusieurs 
fois la méme boule et non pas quw'on a tiré des boules distinctes offrant 
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les mémes caracteres. Clest le cas si les “boules” ont une ¿dentité, par 
exemple un nom ou un numéro d'identité qu'on note au passage (ou qu'on 
imprime sur elles au passage). Formons alors la moyenne des valeurs 
de X pour les boules distinctes tirées; la théorie montre que ce nouvel 
estimateur est sans biais et de variance moindre que 0?/n. 

Ce probleme a été étudié indépendamment par nous-méme (1956 et 
these 1958) et par Des Raj et Khamis [18]; mais il 'agit au fond d'un cas 
trés particulier d'un théoréme général de Basu [3] d'apres lequel, á VPinté- 
rieur d'une famille linéaire d'estimateurs, ce sont les estimateurs symétriques 
qui possedent la variance minimum. 


9 


Estimation par différence et cas analogues. 
€ 


C'est surtout á Zarcovié (a propos des sondages combinés au recense- 
ment démographique yugoslave) que nous devons d'avoir remarqué 
lestimateur par différence, soit I = Y + (2—Y), x étant la variable 
étudiée, y la variable auxiliaire connue, la majuscule concernant la 
population et la minuscule concernant lP'échantillon. Cette formule sans 
biais suppose une forte corrélation entre x et y, plus précisément une 
corrélation supérieure a 0(y)/20(x). Si non sa variance dépasserait 0?/n. 
C'est vraisemblablement le cas quand on compare une donnée y d'un 
recensement á une donnée homologue x d'un sondage. 

Mais un cas plus général, avec (y— tx) au lieu de (y— 2), était 
déja traité dans le manuel de Yates, t désignant une constante connue avec 
une précision supérieure á celle du sondage. 


Estimation par ratio. 


Longtemps Vemploi du ratio x/y de deux expressions aléatoires 
calculées sur le méme échantillon, emploi entre tous banal, causa au 
mathématicien une impression de géne et d'insatisfaction parce V'estimateur 
du ratio par le ratio est un estimateur biaisé. 

Aussi prend-on un grand intérét a la série de travaux publiés par 
Hartley et Ross, Robson, Goodman et Hartley [19], Mickey [20]. 

Ces auteurs ont imaginé des estimateurs du type-ratio (“ratio like”) 
exempts de tout biais, mais non exempts de tout défaut. En premier lieu, 
leur variance n'est jamais tres simple; parmi tous les estimateurs de Mickey, 
la variance n'a pu étre calculée que pour une sous-classe restreinte: de 
son cóté Robson emploie pour ses calculs de variance des moyens extréme- 
ment puissants et lourds (la théorie des polykays). D'autre part il semble 
ressortir des rares exemples numériques connus de nous qu'un estimateur 
de type-ratio améliore la variance quand la corrélation entre x et y est 
faible, et non lorsque'elle est tres accentuée; et on ne rapportait guére 
jusqu'ici une variable x qu'a des y qui lui étaient liées. 
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L'idée initiale semble avoir été d'éliminer le biais en combinant deux 
sortes d'estimateurs par ratio: celui classique de la forme 


r = (2, + 23) / (y, + yo) 


et celui (qu'on proscrivait jusqu'ici á cause de l'ampleur de son biais) 
de la forme 


z ] x L> 
r-=— 4 (dans le cas oú n = 2) 
2 Xy Ya 
Faisons un petit calcul. Si on écrit que Pestimateur (K,-+ K”,.) est sans 

biais, et que le biais de 1” est n fois celui de r, il vient: 


K=nm-lI1;K = -—Iln-— 1. 


Si r et Y ont (du moins en premiere approximation) méme variance Y 
et si on désigne par (1 — e) leur coefficient de corrélation (oú e est positif 
et vraisemblablement petit), la variance de (K, + K',-) s'écrit: 


2ne 
V¡I+ ——— 
| | 


Cette formule montre bien que, si le biais est éliminé, la variance est 
en revanche accrue. Si on accepte la convention, d'ailleurs discutable, que 
la variance et le carré du biais sont additifs, le biais étant de la forme b/n, 
9 
! i : a a b” 
et la variance de la forme a/n, on Wa fait que remplacer — + — par 
n n* 
a 


2ea nds ne de pa A 
+ —— Ainsi tout parait dépendre de l'importance de la corrélation 
n n* 


entre r et 7, 


5. FESTIMATION SANS BIAIS 
REPOSANT SUR DES HYPOTHÉSES DE STRUCTURE 


Les méthodes les plus courantes d'estimation utilisant des informations 
supplémentaires introduisent quelque biais si on ne formule ou ne sous- 
entend une hypothése de structure au sujet de la population sondée. On 
suppose en fait qu'il existe une population infiniment nombreuse (univers, 
superpopulation) d'oú aurait été extraite par tirage au sort la population 
faisant Pobjet de notre étude: par exemple si on étudie une population 
stratifiée, on admettrait que le contenu de chaque strate provient de tirages 
dans des superstrates; s'il y a des unités primaires de sondage, disons des 
villages, on admettrait qu'on les a tiré au sort parmi une infinité de 
villages; si ces villages renferment des logements, on imaginerait un univers 
formé d'un nombre infini de logements parmi lesquels auraient été tirés 
les logements que comprend effectivement tel village; autre chose est de 
savoir si on peut admettre que tous les villages d'une méme strate ont été 
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tirés dans le méme univers de logements. On n'est pas obligé d'expliciter 
la nature de cet ou de ces univers, par exemple de spécifier qu'ils suivent 
une loi normale (ou, comme nous disons, une loi de Laplace-Gauss). 

Si comme estimateur on se sert d'une formule de régression linéaire 
de q er y, il sera commode de postuler que la distribution de probabilités 
de « liée par y admet une espérance mathématique nulle et une variance 
proportionale a y?. Admettre que cette variance est indépendante de y 
n'est pas toujours tres réaliste. 

Quand on use d'une simple estimation par ratio, on a intérét á 
admettre que la droite de régression de x en y passe par Porigine. 

Un cas moins banal mais assez utile est celui de Pestimation pa 
une formule de sondage stratifié; nous disons aussi qu'il y a stratification 
a posteriori, car Clest apres coup qu'on trie Péchantillon par rapport á 
des caracteres auxiliaires y,z ... ofrant la particularité d'étre déja connus 
au niveau de la population. [En anglais on dit “reweighting,” c'est-á-dire: 
changement des coefficients de pondération.] Pour chaque strate (a 
posteriori) on fait une estimation par ratio, de la forme r=5S, x2,/n, le 
dénominateur étant aussi aléatoire que le numérateur; pour qu'il n'y 
ait pas de biais, on admettra que la droite de régression de $,x, en a, 
passe par Porigine et que la loi de probabilité liée a son espérance ma- 
thématique nulle. 

Si on suppose avec Hájek que les lois liées sont normales, on peut 
méme definir les intervalles de confiance autours des estimations. 

Ces idées sont dans Pair depuis des années, plus conscienment 
aujourd'hui qu'hier (oú on oscillait entre des hypothéses de loi normale 
superflues, voire inadmissibles, et une insuftisance d'hypothéses impliquant 
des biais et des approximations). 1l est possible que Cochran en soit le 
pere; en tous cas il en est Pun des auteurs. L'étude systématique d'une 
variance de zx liée par y égale a 4y” a été faite par Des Raj [21] mais on 
avait fait usage bien avant lui, par exemple, du cas g = 1/2. 


6. ESTIMATION SIMULTANÉE 
DE MOYENNES, VARIANCES, COVARIANCES 


La variance étant adoptée comme mesure de lP'imprécision de toute 
estimation, sans biais, de moyenne (ou de total), il importait qu'on sut 
attribuer une valeur numérique á la variance d'une estimation donnée. 
On s'est donc posé le probleme de lP'estimation du couple: une moyenne 
et sa variance. 


Il arrive méme qu'on estime la variance d'une variance, lors qu'on 
redoute que lestimation de la variance soit tres mauvaise. 11 y a quelques 
exemples fácheusement célebres de variance dont l'estimateur pouvait 
(avec de la malchance) devenir négatif (bien qu'une variance soit une 
moyenne de carrés et soit donc positive). 11 devient alors aussi important 
(et plus difficile) d'avoir un estimateur efficace pour une variance que 
pour une moyenne. 
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Avec les estimateurs fondés sur des informations supplémentaires, il 
faut estimer encore les covariances, bref toute une matrice. 


Les ESTIMATEURS BIAISÉS 


L'estimation par ratio comporte un biais et n'en est pas moins des 
plus utilisées. Vouloir á tout prix des estimateurs sans biais serait tomber 
dans le “fétichisme,” mais les estimateurs biaisés posent de sérieux 
problemes. 

L'habitude est prise (on lP'a déja dit) d'ajouter le carré du biais á 
la variance, pour mesurer lP'imprécision d'un estimateur biaisé. 
Géométriquement ceci signifie qu'on forme: 


E(x- ExN*+(Ex — m? 


en désignant par x lestimateur (biaisé) de m. On vérifie que c'est 


E (x — my 


Il sS'agit donc bien d'une véritable distance entre un point m á 
estimer et l'estimateur x. En particulier si les = forment une classe 
parmi laquelle on trouve un estimateur sans biais, on a Ex —m=0; et 
la distance est minimum; ce minimum est justement la variance 


E(x-— Ex = V 


Seulement, si Pon veut comparer (avec le méme échantillon, disons 
bernoullien) Pestimateur ordinaire, moyenne arithmétique simple des 
données échantillon, et Pestimateur par ratio, rien de ce qu'on vient de 
dire ne justifie une comparaison entre E(7¿—mP et E (rY —m)?. Les 
deux estimateurs n'appartiennent pas á la méme classe. 

Personnellement nous voyons dans la variance ce que nous appelons 
une perte d'information; perte car elle est comptée á partir de Pétat de 
connaissance parfaite; information car elle satisfait aux axiomes de l'infor- 
mation la plus générale au sens de Schiitzenberger. Mais il s'agit exclusive- 
ment de la variance de l'estimation sans biais (d'une valeur moyenne). 
Quant a E (1 —m>, ce n'est justement plus une perte d'information, dés 
que Ex — m, n'est pas nul. Dans Pestimation par ratio, nous voyons un 
cas trés particulier d'estimation isomorphe, c'est-á-dire telle qu'estimateur 
(vis a vis de Péchantillon), et grandeur á estimer (vis á vis de sa popula- 
tion) aient la méme expression formelle. On trouve aisément une expression 
de pertes d'information pour l'estimateur isomorphe, en particulier pour 
lestimateur par ratio. 

Le plus remarquable est qu'on retrouve ainsi, comme perte d'informa- 
tion, c'est-á-dire comme mesure de distance (m,x) lVexpression (bien 
connue de tout statisticien) de Plexpression approchée (limitée au second 
ordre) de la variance V (1). Cette variance approximative est exactement 
la perte d'information (These, 1958). 
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On remarquera qu'un estimateur isomorphe est nécessairement un 
estimateur cohérent (“consistent”); c'est-á-dire que, sondant un univers 
fini, Pestimateur et Pestimé coincident quand l'échantillon grandit au 
point de recouvrir le dit univers; et quand on imagine un univers infini, 
si Péchantillon grandit infiniment, Pestimateur converge en probabilité vers 
Vestimé. Par exemple, Vestimateur de type-ratio 7” dont il a été question 
plus haut n'est justement pas cohérent. 

C'est une opinion personnelle de P'auteur que les estimations biaisées 
et non cohérentes sont de qualité inférieure: pour Pinstant tout au moins 
on ne sait leur attribuer que des pertes approchées d'information. 

Si x est l'estimateur de m, on définit avec Wald et Basu une fonction 
de perte W (x,m) telle que W (m, m) soit nulle et on en prend l'espérance 
mathématique EW (x,m) sur toute la distribution de x; on veut alors que m 
rende minimum cette expression. On a admis que W n'était plus néces- 
sairement une fonction, mais une fonctionnelle; par exemple, avec les 
ratios, si m—= A/B,x=a/b avec Ea= A, Eb=:B, W sera fonction de 
A,B,a,b non de m et z. 


8. CAS OU LA LOI DE DISTRIBUTION EST ENTIEREMENT SPÉCIFIÉE 


Le cas dont nous occupons á présent présente un gros intérét théorique, 
car il nous raméne aux théories courantes de Pestimation statistique. On 
est censé sonder une population dont la distribution par rapport á la 


variable X suit une loi connue; on admettra que cette population est 
infinie et on se limitera au cas d'un échantillon bernoullien. Le sondage 
est destiné á fournir une estimation de la moyenne z de X sur la population 
et, accessoirement, de Pécarttype de cette distribution. 


Ce cas ne se rencontre guére en pratique, la méthode de sondage étant 
surtout employée dans les sciences sociales et économiques oú il est tout a 
fait exceptionnel de rencontrer des distributions ressemblant beaucoup a 
des lois théoriques de probabilité. Prenons par example le travail d'Aitchi- 
son pour estimer le revenu moyen des ménages anglais. 11 suppose que la 
distribution des revenus suit une loi de Galton-Gibrat, autrement dit que 
les logarithmes de ces revenus (éventuellement amputés de leur minimum) 
suivent une distribution normale. Or c'est en fait une question trés 
controversée, car la queue de pareille distribution vers les revenus élevés 
difféere de la loi de Pareto chére aux économistes. 

On peut alors avec Aitchison appliquer la théorie de Pestimation du 
maximum de vraisemblance de Sir Ronald Fisher; ici il suffisait d'appliquer 
les formules dues á Finney; dans un autre cas, on aurait eu a résoudre 
des équations compliquées. On ne trouvait d'ailleurs pas un revenu moyen 
bien différent par ce procédé, mais on constatait que sa variance d'échantil 
lonnage changeait beaucoup. 

Ce qui est (á notre avis) plus intéressant, c'est que lestimation du 
maximum de vraisemblance fait partie des estimations isomorphes; elle 
est asymptotiquement sans biais: sa variance est asymptotiquement une 
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perte d'information, et la plus petite possible comme c'est bien connu. 
Ceci sétend a plusieurs parametres (théoreme bien connu de Doob et 
Dugué). 

Il faut maintenant souligner que, pour tous les plans de sondage: 
stratifiés, á plusieurs degrés, etc. ... Pestimateur “blue” coincide avec 
celui du maximum de vraisemblance, si on imagine que la distribution de 
la variable X dans les ménages de chaque commune est un grand échantil- 
lon d'une loi normale—de méme que la distribution des moyennes de X 
par commune, dans les communes d'une méme strate. Or, plus le découpage 
en strates, sous-strates, etc. ... est meilleur, moins de telles hypothéses 
sont de simples vues de Pesprit. Par exemple, la distribution des revenus 
aux Etats-Unis est tres dissymétrique, mais il a été soutenu récemment que 
celle de chaque groupe professionel (par sexe et qualification) était 
symétrique et voisine d'une distribution normale. 

Ainsi les estimateurs “blue” constituent un optimum fiduciel en 
quelque sorte, pour la théorie de Fisher. 


9. LA DISTRIBUTION DES PROBABILITÉS A PRIORI 


Comme nous le disions en commencant, la conception de P'estimation 
de Fisher est fortement battue en breche—non pas chez les statisticiens 
pratic iens de l'estimation numérique (par exemple elle jouit d'un grand 
crédit chez les économeétres américains contre la méthode des moindres 
carrés brutale)—mais chez les théoriciens, et les spécialistes des fondements 
de la Statistique, en particulier. En sondage comme dans les autres domai- 
nes d'application, on appréhende Pintroduction de lois de probabilités 
a priori subjectives; notre opinion personnelle est que l'économiste ou le 
sociologue a déja une propension naturelle trop prononcée á retenir les 
résultats d'un sondage qui confirment ses idées a priori, et á rejeter ceux 
qui vont á Pencontre, en évoquant le manque de sincérité des enquétes 
et le peu d'habilité des enquéteurs; de sorte qu'il serait dangereux de 
lencourager dans cet état d'esprit plus littéraire ou juridique que scienti- 
fique, en autorisant la trituration des données par Pemploi d'une valeur 
centrale a priori conforme aux idées reques et d'un écart-type a priori 
suffisamment petit. Il a été observé déja qu'entre plusieurs estimateurs 
possibles on avait tendance á choisir non le plus “efficace,” mais celui 
donnant les résultats qu'on désire. 


Les moins dangereux ne sont d'ailleurs pas nécessairement les mathé- 
maticiens qui (tel Pauteur) se piquent de faire des sciences sociales. 


On va néanmoins s'arréter sur un cas particulier étudié, par Lindley 
[22] entre autres. 


Lindley calcule l'information au sens de Shannon, ce qui est la 
conception usuelle. 11 sonde une urne infinie que suit une loi normale 
de moyenne 8 et d'écart-type o; il 'agit d'estimer 9 et on lui attribue une 
loi de probabilité a priori également normale, de moyenne 4 et d'écart- 
type 7. Tirant alors un échantillon de taille n, de moyenne Y, on voit 
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facilement que la loi de probabilité a posteriori de 6 est ¿galement normale, 
avec pour moyenne la moyenne pondérée de K avec le poids 1/7, et de 7 
avec le poids 1/0?; la somme de ces poids est égale a l'inverse du carré 
de Pécart-type. 

Il en résulte que, quelques soient au départ 4 et r, la loi a posteriori 
de 6 tend vers la loi de 7 lorsque n tend vers l'infini. En outre, pour n 
un peu grand, ces lois ne different pas si (n'ayant pas d'idée claire a priori 
su 9) on a eu soin de prendre l'écart-type a priori 7 trés grand. 

Ce résultat ne nous a pas paru utile au premier abord. Mais (á la 
réflexion) on peut se demander s'il ne s'étend pas á une population formée 
de strates et d'unités de sondages tellement bien découpées qu'il ne 
subsisterait plus que des grands échantillons de distributions normales a 
lintérieur de ces urnes. 

Ceci suppose l'indépendance des tirages, et aussi celle des distributions 
a priori (normales) des diverses moyennes. 


Ainsi il n'est pas impossible de raccorder les divers concepts d'estima- 
teur-optimum, d'une maniére en quelque sorte fiducielle, c'est-a-dire en 
faisant des réserves sur la réalité des phénomeénes. D'ailleurs les estimateurs 
employés sont un optimum pour une classe de distributions plus large que 
les lois normales, comme ceci a été montré á propos d'économétrie (ce 
qui sort du cadre du présent exposé). 
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SOME STRATIFIED SAMPLING PLANS IN 
REPLICATED DESIGNS 


W. EbwarDs DeEMING, U.S.A. * 
RESUMEN 


El propósito de este artículo es describir algunos de los 
posibles procedimientos de muestreo estratificado, y comparar 
las ganancias en la precisión que con cada uno de ellos se 
obtiene con los respectivos costos. Los procedimientos que el 
autor presenta siguen diseños de muestreo reiterado con aplica- 
ción especial de las muestras interpenetrantes de Mahalanobis. 

La estratificación es una forma de usar la información 
estadística disponible para lograr una estimación mejor que la 
que sería posible obtener de otro modo. La información 
estadística que se usa en un diseño estratificado puede ya 
existir para todas las unidades de muestreo en el marco (como 
en el último censo), o puede exigir pruebas o entrevistas en 
una muestra preliminar. La estratificación tiene en realidad 
muchos significados y muchas formas de aplicación. 

Una ventaja de la estratificación, además de la ganancia 
en la precisión, es la de disminuir el coeficiente del cuarto mo- 
mento, con mejoramiento en la estimación de la varianza de z 

El autor describe varios planes de estratificación que dis- 
tingue con las letras A, B, C, etc., y emplea el plan A como 
elemento principal de las comparaciones entre ellos. 


PRELIMINARY NOTE 


The purpose of stratification. Most frames for censuses, complete 
testing, or sampling, are already stratified into natural geographic zones. 
Material, as it comes to us in the frame, is never thoroughly mixed. This 
natural stratification is automatic and costs nothing. One example is 
census statistics, which are usually in some sort of geographic order. 
Another example is industrial product, cach item of which emerges at the 
end ot the production-line in the order in which it was made. 

It” sometimes pays to rearrange the sampling units into more 
homogeneous groups called strata. We sometimes rearrange all the sampling 
units in the frame before we draw the sample, and sometimes we rearrange 
only the sampling units in the sample, depending on costs. The aim of 
this paper is to describe some of the possible procedures of stratified 


sampling, and to compare the gains in precision with the costs. “The 
procedures will follow replicated sampling designs as a special application 
of Mahalanobis's interpenetrating samples. 


a Consultant in Statistical Surveys, 4924 Butterworth Place, Washington 16; Professor of 
Statistics, New York University. This article was prepared in December 1959. 
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SOME SIRATIFIED SAMPLING PLANS 


Stratification is one way to use statistical information in our possession 


to acquire a better estimate than would be possible otherwise. The statistical 
information that we use in a stratified design may already exist for all 
the sampling units in the frame (as from the last census), or it may 
require tests or interviews of a preliminary sample. Stratification has in 
fact many meanings and many ways of application. 

An advantage of stratification, aside from gain in precision, is a 
decrease in the fourth moment coefficient, with improvement in the 
estimate of Var z. 


Summary description of several plans.* 1 shall give at this point a 
brief summary of several stratified plans. I shall distinguish the various 
plans by the letters A, B, C, etc. Plan A is the basis for comparison, as 
it will be a replicated sample of the material just as it comes to us in the 
frame, without further stratification. We cannot be sure in the case of 
new material just how effective the natural stratification is, but Plan A, 
as we use it, will capture any possible gain from this source. We may 
think of Plan A as a proportionate stratified sample, where the strata 
are zones in the frame. Later sections show directions in more detail. 


Plan A. Sample the frame as it is, with no rearrangement 


FTHE PROPORTIONS P, KNOWN 
Classify the whole frame 


Plan B. Classify all the sampling units of the frame. Then use proportionate 
allocation. 


Plan C. Classify all the sampling units of the frame. Then use Neyman allocation. 
Classify only the n sampling units of the sample 


Plan D. Draw the sample as in Plan A, the size being determined exactly as 
for Plan B. Then classify the sampling units into the various strata. Use the entire 
sample; no thinning. 


Plan E. Draw the sample as in Plan A, the size being determined as in Plan C. 
Then classify the sampling units into the various strata. Thin the strata to reach the 
Neyman ratios n, : n,. Choose the number »n' so that with as little thinning as possible, 
the total sample will turn out to be about equal to the desired size n 


Classify only enough sampling units to fill the quotas » 


Plan F. Fix the sample sizes n, by proportionate allocation, as mn Plan B. Then 
draw sampling units one by one from the zones in the frame and classify them into 
the various strata until all the quotas n, are full. Discard any sampling unit that 
belongs to a stratum whose quota is full. Form the estimates and the variances as 
in Plan B. 


Plan G. Fix the sample-sizes n, by Neyman allocation, as in Plan C Proceed 
otherwise as in Plan F, but form the estimates and the variances as in Plan C. 


' The theory and other illustrations of the various plans appear im Chapter 15 of my book 
Sample Design in Business Research (Wilev, 1960) 
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PROPORTIONS P, NOT KNOWN 


Classify only a preliminary sample of size N” to estimate the proportions P,. 


Plan H. Draw as in Plan A a preliminary sample of fixed size N'. Classify only 
these sampling units, not the whole frame. Then thin proportionately the samples 
from the various strata to reach a total specified size. Form the estimate X as directed 
later. 


Plan TI. Draw as in Plan A a preliminary sample of fixed size N”, and classify 
only the sampling units in this preliminary sample, not the whole frame. Then thin 
the samples from the various strata by the use of ratios dictated by the Neyman 
allocation to reach a total specified size. Form the estimate X as directed later. 


STRATIFICATION BEFORE SELECTION 


Some notation and definitions in the frame. 1t will save time, before 
we go on, to introduce some definitions. 


the average population () 
per sampling unit 


a = P, a, + P¿ az + P3az = 


P.o, + Pz 0 + Ps 0 the weighted average (2) 
standard deviation 
within strata 


2 2 2 » 14 » Jer: » 
=P, 0 +P,03+P3 03 the weighted average (3) 
variance within strata 


P,(a, — a) + P,(a, — a)” + P3(az — a)” 


= Pa +P,al + Pzaz — a? the variance 
between strata 


0% + 0, the total variance 


= Q, 0 +0Q,0+0Q53 03 the reverse internal 
variance (P¡+0Q¡= 1) 


= Q 0, +00, +05 03 the average reverse 


internal standard 
deviation 


It is helptul to see some of these definitions arrayed in Table 1. 


More detailed description of Plan A. 1 now give fuller directions 
for the plans, step by step, starting with Plan A. The reader will in practice 


discover his own short-cuts, which will vary with local conditions and 
preferences. The notation will be obvious, 1 believe, by a glance at Table 2. 
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TABLE 1. NOTATION AND DEFINITIONS FOR THE FRAME 
Extension to more strata will be obvious 


M is the number of strata (here M —= 3) 


Between the 
Number of sampling Population populations of 
units the sampling units 


A within the stratum 


proportion of 
sampling units | Average | 
in the frame per Total 
3ampling in the Standard Vari 
unit in deviation 
stratum 
the 


stratum 


Stratum 


ance* 


Total for the frame 


Average per stratum 


Average per sampling 
unit in the frame... 








* The weights are P,, Pg Py. 
PLAN A 


Decide with the aid of the equation 


l Y 
| [Plan A] 


| 
N 


the size n of the sample required. Or, the equivalent form 


O 
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of Equation (8) may be handier, as it leads directly to Step 2. The symbol y 
is the value desired for the standard error of z. The symbol o? is the 
average variance between sampling units within zones. In sampling new 
material, it is usually wise to be conservative and to assume that there 
will be little or no gain from the natural stratification, which means that 
we should at first set o? equal to the predicted total variance between the 
sampling units in the frame. Later on, with experience, we may decrease a? 
to allow for the gain from natural stratification in the frame. 

2. Compute the zoning interval Z— 2 N'/n for 2 subsamples, 10 N/n 
for 10 subsamples. Form zones of Z consecutive sampling units in the 
frame. 

3. Draw with random numbers between 1 and Z, 1 sampling unit 
from every zone. These drawings form Subsample 1. Draw another sam- 
pling unit from every zone for Subsample 2, and likewise for the other 


TABLE 2. NOTATIONS AND DEFINITIONS FOR THE SAMPLE 


Population Mean population Estimated Variance 
Stratum in the per total of this 
sample sampling unit population estimate 


x, z-population in 
Stratum 1 


z—population in 
Stratum 2 


population in 
Stratum 3 


* The variances are additive only if the N; (or P;) are 


known and used in the estimate X. 


subsamples if any. Mark each sampling unit to show which subsample it 


belongs to, and which zone it came from. 


4. 


Carry out the interviews or the tests on the entire sample. 


Form the x—population by subsample. 


Form from Subsample : the estimate. 


Xi) = Laa 


where (“Y is the z-population in Subsample ¿. 
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Form the final estimate 


X =Z. (12) 
from all subsamples combined. Z is the average of the 2, where 26, is 
the z-population in Subsample ? 

8. Estimate the precision attained. For example, if there were 10 


subsamples and 1 thick zone,* we could use the range between the 
maximum and the minimum of the 10 values of 2'Y to form the estimate 


1 


mm» (2) 


0 Las q) (13) 


where ('¿ denotes an estimate of the coefficient of variation of 7. One 


may of course estimate ('¿ by the sum of squares, if he prefers. 


Ten subsamples and 1 thick zone give 9 degrees of freedom. One may 
acquire more degrees of freedom by tabulating the results in 2 thick zones. 
(It is a simple matter to form 2 thick zones so as to get almost exactly 
18 degrees of freedom. For example, if the material is highly variable 
from 1 thin zone to another, one may allot odd thin zones to Thick Zone 1, 
and even thin zones to Thick Zone 2.) 

If one is using 2 subsamples, it is advisable to tabulate the results 
in 8 or 10 or more thick zones to gain sufficient degrees of freedom, and 
to use the sum of squares in the estimate. 
estimate the precision (, 
design .? 


Fhe computation by which to 
is in any case valid and simple with a replicated 


Proportionate allocation (Plan B) 


We proceed now to give fuller 
directions on Plan B 


We assume in Plans B and C that all the sampling 
units in the frame have been classified into strata and counted, and that 
the sampling units in Stratum | have serial numbers 1 to N,, in Stratum 
2 from 1 to N,, etc. 

It is advisable, in all the plans, to maintain in each stratum the 
order in which the sampling units appeared in the original frame. By 
doing so, we capture the benefit of the natural stratification that already 


existed in the frame. This rule is not essential to the theory, but it is 
good for efficient design 


PLAN B 


Decide with the help of the equation 


[Plan B] 


Editorial note See the wticle b Dn Dor 
the title, “Simplificaciones en el 
Iguales y sin Etapas,” p. 277-305 


2 W. Edwards Deming, “On simplifications of sampling design through replication with 


equal probabilities and without stages,” Journal of the American Statistical Association, volume 5l, 
March 1956: pages 24-53 


nmg published im é idística No. 55, under 
Diseño del Muestreo Mediante Reiteración con Probabilidades 
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2. Compute the zoning interval Z = 2 N /n for 2 subsamples, 10 N /n 
for 10 subsamples. Form zones of Z sampling units in all strata. 

3. Draw with random numbers between 1 and Z, 1 sampling unit 
from every zone, onward through all strata. These drawings form 
Subsample 1. Draw another sampling unit from every zone for Subsample 
2, and likewise for the other subsamples if any. Mark each sampling unit 
to show which subsample it belongs to, and which stratum, and which 
zone it came from. 


4, Carry out the interviews or the tests on the entire sample. 

5. Form the 2-populations by subsample: designate them 21", 22, 
etc., where 2 is the x-population in Subsample ¿ through all strata. 

). Form from Subsample ¿ estimates as in Step 6 of Plan A. 

Form the final estimate X as in Step 7 of Plan A. 

8. Estimate the precision obtained, as in Plan A. No weighting is 
required, because all the sampling units in the frame, regardless of stratum, 
have in proportionate stratified sampling (Plan B) the same probability 
of selection. We may, of course, form separate estimates by stratum, if 
we need them. The estimates of X and of Var X are additive, as in 
Table 2. The degrees of freedom, however, are not additive.3 


Neyman allocation (Plan C). One may be able in some problems to 
improve on proportionate sampling by altering rn, and n, in proportion 
to dy and ds. This is so when it is possible to form strata so that their 
variabilities (as measured by 0, and 0») are distinctly different. Such a 
plan was first put into practice by Neyman.* Plan € will denote Neyman 
allocation when we fix the sample-sizes in advance. The steps in Plan 
C follow 


PLAN ( 


Decide with the aid of the equation 


(5,)” 


[Plan C] 


(15) 


the size n of the sample required. Compute for Stratum ¡ the sample-size . 


(16) 


2 This formula in a more general -form for any number of strata (or thick zones), and for 
any number of degrees of freedom in each stratum, was first given explicitly by F.E. Satterthwaite, 
“An approximate distribution of estimates of variance components,” Biometrics, volume 2, 1946: 
pp. 110-114 

* — J. Neyman, “On the two different aspects of the representative method,” Journal of the 
Royal Statistical Society, volume XCVII, 1934: pages 558-606 The mathematical equations for 
Neyman allocation were nevertheless published earlier by A. Tschuprow, Metron, No. 3, 1923, 


”o 


page 672, but so far as 1 know, Tschuprow made no use of his formulas. 
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2. Compute the zoning intervals Z,=2N;¡/n; for 2 subsamples, 
10 N¡/n; for 10 subsamples. See Step 2 under Plan B. Form the zones in 
the various strata with the zoning intervals just calculated; see Step 2 under 
Plan B. The procedure is to make the selections from every stratum in 
Plan A. 

3. Draw with random numbers between 1 and Z,, 1 sampling unit 
from every zone of Stratum 1; with random numbers between 1 and Zo, 
1 sampling unit from each zone of Stratum 2; etc. The sample so drawn 
is Subsample 1. Draw another sampling unit from every zone for Subsample 
2, and likewise for the other subsamples if any. Mark each sampling unit 
to show which subsample it belongs to, and which stratum, and which 
zone it came from. 

4. Carry out the interviews or tests on the entire sample. 

5. Form for Subsample i the z-populations 2%, 2, 2? stratum 
by stratum. Do this for every subsample. 


6. Compute for Subsample ¿ 
rÍ r la) r f r la) 
X me Zi; Yi + Zo) zS + Lo La 
=X, +X>3 +X3 (17) 
This is the estimate that Subsample : furnishes for the total z—population 
in the frame. The 3 terms, one by one, are estimates from Subsample : 
of the —population stratum by stratum. 


7. Calculate (y = (*¿, following the advice in Plan A. For 
example 


=v [x0, — x0,] (18) 


for 10 subsamples. 
One may require separate estimates by stratum, in which case the 
procedure is to compute 


for Stratum (19) 


for Stratum (20) 


Stratum 


Stratum 
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for k subsamples. Varzx signifies an estimate of Var x, 7, is the average 


of the k individual z-populations 7? in Stratum 1, zz has a similar 
definition in Stratum 2. The estimates and their variances are additive, 
as in Step 8 under Plan B; hence we form 


X =X,+X,+X, (23) 
Var X = Var X, + Var X,+ Var Xa (24) 


STRATIFICATION AFTER SELECTION WITH PROPORTIONS KNOWN 


Plans D, E, F, G. These plans 


(like Plans B and C) all require 
advance knowledge of P,, Pa, Pa 


PLAN D 


Decide with the aid of the equation 


Var T= - : — 0) [Plan D] 


a, + 2) (25) 


n 


the size n of the sample required. Proceed to draw this sample exactly as 


in Plan A. 


2. Compute the zoning intervals Z —= 2N'/n for 2 subsamples, 10 N /n 


for 10 subsamples. Form zones of Z sampling units in the frame. 


3. Draw with random numbers between 1 and Z, 1 sampling unit 
from every zone. “These drawings form Subsample 1. 


4. Classify each sampling unit into its proper stratum. Mark each 


sampling unit to show that it belongs to Subsample 1, which stratum, and 
which zone it came from. 


5. Repeat Steps 3 and 4 for Subsample 2, and for the other sub- 
samples if any. The sample-sizes n,%, ny, ny 
random variables. 
the subsample .) 


thus drawn will be 
(The subscripts refer to the strata; the superscript is 


6. Carry out the interviews or the tests on the entire sample. 


7. Let zx,” denote as before the x-p ¡pulation in Subsample ¿ from 
Stratum 1, with similar definitions for 23, 23 


Form for Subsample : 
the estimate 


(4% 
1 1 


X= 4 NN 


17 M3 


Xi +FX3+X 
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of the total z-population. Do this for every sample. The 3 terms, one 
by one, are the estimates that Subsample ¿ furnishes for the x-population 
in the 3 strata. 


8. Form the final estimate 


and if desired 


X 
>= e. 
Ñ 


for the average x-population per sampling unit over all the whole frame. 


9. Calculate C'y = C;, following the advice in Plan A. For example, 


1 ; 
—lXo. —X (29 
10 X [ mar e] , ) 
for 10 subsamples. 


Convenient modifications will occur to the user in practice. For 
example, it may be necessary to defer the classification of a sampling 
unit until after the final test or interview. This state of affairs introduces 


no complication. One simply proceeds into Step 7 after the final tests 
are complete. 


Another point is that one may calculate the estimates X,, Xy, Xy, 
for the strata separately, if there be need of them. 


Then also, the user will in practice probably prefer, as 1 do, to make 
all his drawings from Zone 1 before he proceeds into Zone 2. The first 
sampling unit drawn from any zone belongs to Subsample 1; the second 
sampling unit belongs to Subsample 2; etc. The above description of the 
steps, as written, has the advantage, 1 hope, that it leaves no doubt about 
the independence of the subsamples, except for the fact that one will 
usually draw them without replacement. 


PLAN F 
Decide with the aid of the equation 


Plan C 
(5,,) e l 
o E HA [Plan E] 


n N n 
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the size n of the sample required. Decide also with the help of the equation 


n=" T="wYP,T, (31) 


the size of the preliminary sample. Here T;, is the thinning ratio in 
Stratum ¿. For example, if we were to retain all the sampling units in 
Class 1 that appear in the preliminary sample, and half the sampling 
units in Class 2, then would 


1 


T=P 
1 + > 


P, (32) 
2. Compute the zoning interval Z=2N/n” for 2 subsamples, 


10 N/n' for 10 subsamples. Form the zones in the frame; see Step 2 under 
Plan B. 


3, 4, 5. Proceed as in Steps 3, 4, 5 of Plan D. The sizes of the 
preliminary subsamples so drawn will be random variables in every stratum 
and in every subsample. 


6. Decide on the most likely ratios 0,: 0,: az for the chief character- 
istic that the sample is to measure (hereafter, the x-population). 


- 


7. Fix for the next step the thinning ratios by the Neyman allocation 


Ny N> N3 
o y 2 e e E (33) 
ny Na N 3 


in which n,,n,, etc., are the sizes of the preliminary sample in the 
several strata. 


8. Thin the strata that require thinning. 

The thinning ratios are relative, and the size n' of the preliminary 
sample was supposedly chosen so that the class with the biggest «, will 
not take any thinning at all. Thus, if c,: 0,: og were 1: 2: 4, we should 
leave Stratum 1 as it is; retain 1 sampling unit at random from every 2 
of Stratum 2; retain 1 sampling unit from every 4 of Stratum 3. A 
convenient arrangement is to tie the beginning of Subsample 2 to the 
end of Subsample 1, to leave no gap. The final sample-sizes n,W, nal", etc., 
in Subsample : will all be random variables. 


9, 10, 11. Proceed as in Steps 7, 8, 9 of Plan D. 


PLAN F 


1. Decide the desired sample-size n as in Plan B. Compute also 
the sample-sizes n; = mn P;, for Stratum ¿ as in Plan B. 


2. Compute the zoning intervals Z, — 2N;¡/n;, for 2 subsamples, 


10 N;¡/nm; for 10 subsamples. 
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3. Divide the frame into zones of Z, sampling units. Draw a sampling 
unit from Zone 1. If it belongs to Stratum 1, mark it so. If it belongs 
to some other stratum, ignore it and draw another and another until you 
get one for Stratum 1. Move into Zone 2 and repeat the procedure. 
Continue thus through all the zones. “The units so obtained belong to 
Subsample 1 of Stratum 1. 


4. Repeat the same procedure for Subsample 2 and for the other 
subsamples, if any, to complete the subsamples for Stratum 1. 


5. Divide the frame into zones of Z¿z sampling units and repeat 
Steps 3 and 4 to obtain the sample for Stratum 2. 


6. Use the same procedure for Stratum 3, and for the other strata 
if any. 


7-11. Proceed as in Steps 4-8 of Plan B. 
PLAN G 


1. Decide the desired sample-size n, as in plan C. Compute also 
the sample-sizes n,= nm P,0;/9, for Stratum ¿ as in Plan C. 

2. Compute the zoning intervals Z,=2N;¡/n; for 2 subsamples, 
10N;¿/n; for 10 subsamples. 


3, 4, 5,6. Proceed as in Steps 3, 4, 5, 6 in Plan F. 
7-11. Proceed as in Steps 4-8 of Plan C. 


In Plans F and G, the sample-sizes are fixed in advance: in Plans D 
and E they are not; they are random variables. That is why, as the 
student may have observed, in Plans F and G we may form the estimate X 
directly, whereas in Plans D and E we must form separate estimates by 
stratum and then add them. The variances of the plans with fixed sample- 
sizes are slightly smaller than the variances of the plans with variable 
sample-sizes for the same total number n of sampling units. The dif- 
ference lies in the term 0¿/n. However, in Plans F and G with fixed 
sizes there is the additional cost of classifying some units, only to find 
that we cannot use them in the final sample because the quotas n;. 
are already filled. 


Stratification after selection, continued; Plans H and 1. In the 
previous plans, the proportions P, were known, and we made use of them 
in fixing the sizes of the samples in the various strata, and in forming 
the estimates. We now encounter the problem were the proportions P, are 
not known. What we do is to estimate the proportions P, from classification 
of a preliminary sample of size N”, which the reader will observe, serves 
as a new frame. Once we have this new frame, Plan H will resemble 
Plan B; Plan I will resemble Plan C. 
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8. Carry out on the final sample the main interviews or the main 
tests. 


9. Calculate for Subsample : 


(1) 
cul TY , ” 
7" = yP — [Sum over all strata] (37) 
n; 


- (4) 


Z =awv. 7 (38) 
a? is the population in Subsample ¿ from Stratum 1. 
10. Calculate 


ñ =- — [12 - 2] (39) 


for 10 subsamples, or use the sum of squares if you prefer. For 2 subsamples, 
form enough thick zones, as in Plan A. 


PLAN I 


Decide with the aid of the equation 


(7,)" E 1 Ho: , 
, (y) (7) 4 tra 1 


o 


> 


- ” +. ” 
n N' N” and with »] 


r If N is large compared with 
e 5 (40) 
the size m of the sample required. 


2. Compute the optimum size N” of the preliminary sample. The 


equation for this is 
[Due to Neyman*] (41) 


c, is the cost of classifying a sampling unit in the preliminary sample, 
and cz is the cost of interviewing or testing a sampling unit in the final 
sample. 

3 and 4. Draw the preliminary sample N”, as in Plan H. 


5. Carry out the preliminary tests or interviews on the entire 
preliminary sample to acquire information by which to classify every 
sampling unit therein. Mark each sampling unit to show which stratum 
it belongs to. Maintain in each stratum the order drawn. 


5 J. Neyman, “Contributions to the theory of sampling human populations,” Journal of the 
American Statistical Association, volume 33, 1938: pp. 101-116 
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STRATIFICATION AFTER SELECTION WITH PROPORTIONS NOT KNOWN 
PLAN H 


Decide with the aid of the equation 


A ES 1 2 1 1 1 9 1 1 ; 
e >) oa + + Her(Ff-7. 


[Plan H] 
[I£ N is large compared with 
N” and with n] (34) 


the size n of the sample required. 


2. Compute the optimum size N” of the preliminary sample. The 


equation for this is 


n Tw C1 


e (35) 
N 0% Ca 

c, is the cost of classifying a sampling unit in the preliminary sample, 
and ca is the cost of interviewing or testing a sampling unit in the final 
sample. 


3. Compute the zoning interval Z — 2 N /N” for 2 subsamples, 10 N/N” 
for 10 subsamples. Form zones of Z consecutive sampling units in the 
frame. 


4. Draw from the frame, just as you would in Plan A, a preliminary 
sample of size N'. Mark each sampling unit to show which subsample 
it belongs to, and which zone it came from. 


5. Carry out the preliminary tests or interviews on the entire 
preliminary sample to acquire information by which to classify every 
sampling unit therein. Mark each sampling unit to show which stratum 
it belongs to. Maintain in each stratum the order drawn. 


6. Record for Subsample ¿ the number of sampling units in each 
stratum, N,, N2'", etc. These counts give the estimates 


BO <= (N;: NO, PP = (Ni: NP, etc. (36) 


“ 


of the proportions P,, Pa, etc. Form these estimates for every subsample, 
and for all subsamples combined. 


7. Reduce the number of sampling units proportionately in all strata 
and in all subsamples, to reach the required total sample of size n, decided 
in advance. For example, to retain 1/3 of the preliminary sample, select 
by random numbers, for the final sample, 1 out of every 3 consecutive 
sampling units in the preliminary sample. This reduction in size is 
called thinning. 
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Certain facts presented themselves: (1) The interviews and tests in 
aim b are long and expensive (hereafter this will be known as the L-test); 
(2) the L-test should therefore concentrate on the retarded families, and 
not dissipate itself on the much larger stratum of nonretarded families. 
(3) In aim b it was best, from the standpoint of statistical efficiency, that 
the number of tests should be about equal in the 2 groups. 


Enquiry disclosed the fact that there is a simple, brief, and inexpensive 
test, called the Wexler-Bellevue test (hereafter the W-B test), which will 
classify a person above or below any designated point on the psychological 
scale, in almost exact agreement with the L-test (which, however, served 
many other purposes). Use of the W-B test would thus permit quick and 
inexpensive classification of the families im a preliminary sample into 
two classes: 


Class 1: Families that are retarded, according to the W-B test; 
Class 2: All other families. 


Because of a fortunate relation between proportions and costs, this 
sample turned out to be efficient for both aims a and b. 
p 


The plan of sampling. Once the usefulness of the W-B test became 
clear, Plan 1 emerged as the best plan to use. Here is a brief description 


of the procedure: 


1. Draw a master sample of about 2600 dwelling units in 10 subsamples, about 
260 dwelling units in each subsample. The size of the master sample was chosen so 
that it would be big enough to furnish the preliminary sample N”, 

2. Conduct a pilot study on one subsample (Subsample 10) to learn something 
about the proportions P, and P,, and to get some experience and some figures on costs; 


to classify the families in the pilot study into Classes 1 and 2, on the basis of the 
W-B test. 


3. Study by the L-test the families in Class 1, to estimate the distribution of 
retarded persons in Class 1. 


4. Draw up the sampling plan and procedure. Decide on the thinning ratios 
and on the size of the final sample. Proceed with the field work and tabulations. 


The pilot study would cost very little extra, as it was a portion of 
the main study, carried out in advance up to the point of thinning Class 2. 

The results of the pilot study are in Table 3. The statistical 
characteristics of the 2 classes and for both classes combined appear below 
the table. The L-test conducted in Class 1 disclosed the fact that 1 family 
classed as retarded by the W-B test was actually not retarded. Thus, the 
W-B test made an excellent separation, though not perfect. 


Of the 257 families in the pilot study, 57 went into Class 1 and 200 
into Class 2. These figures gave the preliminary estimates of P, and Pa 
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6. Decide on the most likely ratios 0,: 0: 03 for the chief character- 
istic that the sample is expected to measure (hereafter, the x—population). 


Fix the thinning ratios n;: N', by the Neyman relations 


(42) 


Comparison of the variances of Plans A, B, C. 1t is a simple matter 
to show that the following relations hold between the variances of Plans 
A, B, C. The letters A, B, C denote variances. 


2) (43) 


o 


(44) 


(45) 


(46) 


The last 3 equations, involving Plan C, disregard 1/N in comparison 
with 1/n. 


EXAMPLE 


An example of Plan I: A survey of mental retardation. “This was 
a study of a sample of families in the State of Delaware to determine inter 
alia the prevalence of mental retardation. It turned out to be possible, 
by stratifying a preliminary sample on the basis of the relatively cheap 
Wexler-Bellevue test, to cut the cost of the field-work to about 46 percent 
of what its cost would have been without benefit of statistical theory. The 
calculations for the design of the sample follow. From a statistical 
standpoint there were two main aims: 


a. To make an estimate of the prevalence of mental retardation (the average 


number of retarded persons per family); 


b. To carry out certain psychological tests and measurements in both retarded 


and nonretarded families (a retarded family being one in which one member or more 
over 10 years of age is retarded). 
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that appear in the table. The estimates were good enough for planning, 
but not good enough to permit use of Plan E. 

It was too expensive to conduct the L-test on the 200 families of 
Class 2, but it was possible by the aid of expert knowledge (not mine) 
to predict close enough the number of nonretarded families amongst the 
200 families of Class 2, and thus to fix the sample-sizes and the thinning 
ratios. 

This example provides an illustration of the sampling of new material. 
The pilot study gave the information that we needed about Class 1, and 
expert knowledge furnished all the information we needed about Class 2. 


Optimum sizes of the sample. For the Neyman allocation of the 
final sample to the two strata we take 


ÑN, 0, 


No = N; E 
Ñ, o; 


200 X 0.14 A 
= ————— n¡ =071 9, 
57 EA 0.69 


whence 


n=n+n=17n, (48) 


Considerations of cost and of the expected precision shown by Equation 
imfra limited the final sample to about 400 families, which should be 
distributed as follows 


n, = 400/1.7 = 235 in Class 1 
(49) 
n, = 165 in Class 2 
For the size N” of the preliminary sample we make use of Equation (41) 
in which c, is the average cost of using the W-B test in 1 family of the 


preliminary sample, and cs, is the average cost of the L-test in 1 family of 
the final sample. The pilot study showed that 


C1 $ 6 


whereupon 
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If n = 400, then the optimum preliminary sample should be 
N” = 400/9.16 = 2.500 
which will divide itself approximately into 
N'P, = 550 families in Class 1 
N' P, = 1950 families in Class 2 


On this basis we calculate the thinning ratios 


] 
; 
=z 54) 


That is, we select 1 family at random from each successive 2 families in 
the preliminary sample of Class 1, and 1 family at random from each 
successive 12 in Class 2. “These convenient ratios will give almost the same 
precision as the exact ratios. With these numbers the proposed sample 
should give 


(55) 


0.26? 0.32 
400 2500 


0.00017 + 0.00013 = 0.00030 


o; = W0,00030 = 0.017 


Cz . 
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FABLE 3. DISTRIBUTION OF RETARDATION 


Class 1 Class 2 
(From the pilot study of 57 families) (By expert knowledge) 


1 have O persons retarded 196 have 0 persons retarded 
39 ” 1 ” ” 4 ” 1 ” ” 
11 ] Se ; O ” 2 or more persons 
6 ¿ retard<d 
0 


Variance 200 = (0,02 


Standard deviation q a >». 0.14 


200 200 


Both classes combined 


57/257 = 0.22 
200/257 = 0.78 
P, a, + Pza, = 32 
= P,0, + P, 0, = 0.12 
P, (a, — a) + Pa (as — a) 
P, P,(a, — ay” = 0.32 


= 0, +0 = 0.44 
= P; O; + P, 0, = 0.26 


This precision is sufficient, in view of the uncertainties of the tests, 
and of difficulties of definition of residence, nonresponse, and the like. 


For reduction of the master sample from 2600 to the preliminary 
sample of size N” = 2500, it was convenient to delete 1 sampling unit 
in every successive 13 through all 10 subsamples. 
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Calculation of the expected saving over Plan A. Now let us see 
what size of sample this same precision would require if there were no 
stratification. Then would 


Var 7 o [Plan A, no additional 
a n stratification] 


With Var Y = 0.00030, y? = 0.44, we find that n = 1500. 


Now how about the relative costs of Plans A and 1? The computations 
are in Table 4, whence we see that Plan 1 will cost only about 45 percent 
as much as Plan A (no stratification). 


TABLE 4. COMPARISON OF THE COSTS OF PLANS A AND I 
IN THE SURVEY OF MENTAL RETARDATION 


Preliminary sample Final sample 
| 1 
Number of Cost per Number of | ost per 


families family families family 


$ 75,000 


2400 56 0 5 34,400 


SO cada Ne MN l $ 40,600 





Saving effected by Plan 40,600/75,000 


COMPARISON OF COSTS 


Table of comparative costs. Table 5 shows how the average cost of 
any plan will compare with the average cost of Plan A, when both plans 
yield the same variance, viz., (1 — »/N) o?/v, This table is helpful in 


the choice of plan. The assumptions are in the heading of the table. 


There is the further assumption that the cost c, or test of an interview 
is the same in all strata. 
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=] 
o 
S 


There are occasional small intangible costs, besides those in the 
table, not easy to evaluate: these are mentioned in the notes at the end 
of the table: though small, they may serve to tip the balance one way or 
another in case the costs in the table for two plans turn out to be about 
the same. One may do well to reduce the size of the sample in a stratum 
where the cost of interviewing or of testing is excessive, and to build it 


up in other strata. The table of costs will then not be exactly applicable. 


We may illustrate the use of the table with an example. Suppose that 


N = 10,000 
y= 500 
Ci == 20€ 


vc, = $2500, the cost of Plan A 


Then the cost of Plan B will be 









Ne, + XK (e) = 10,000 X 0.20 + 2500 X 0.64 


O 





= $2,000 + $1,600 = $3,600 


which is more than the cost K — $2,500 for Plan A. 


Suppose that gz: 0, were 3. Then Plan D would cost 


A 






K (2) did (2) AS ES] = $1,600 + 0.20 X 500 X 0.64 
O 


g TG w 





+ $5.20 Xx 37 = $1,600 + $64 + $46.80 = $1710.80 


which is less than the cost of Plan A or of Plan B. 
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TABLE 5. COMPARATIVE COSTS OF THE VARIOUS PLANS OF STRATIFIED 
SAMPLING THAT WILL DELIVER THE SAME PRECISION AS PLAN A WILL 
DELIVER WITH THE SIZE OF SAMPLE EQUAL TO »v. 


Assumptions: (1) The frame is not already stratified; (2) The unit costs of classifica- 

tion, and of interviewing or of testing, are the same in all strata. c, is the cost to 

classify one unit. In plans H and 1 the cost c, may include the cost of a preliminary 

test or short interview. c, is the cost to interview or to test one unit in the final sample 
for the main study. 


Average cost Remarks 


A No stratification....... ca E This cost K and the sample-size » 


furnish the bases for reference" 


03=0/|VvV 


FPHE PROPORTIONS P, KNOWN 
CLASSIFY ALL N SAMPLING UNITS IN THE FRAME 


PP A 5 A A A A A A AA A AA A A A o 


Proportionate allocation; sample- w y? ra í 1 
sizes ni fixed in advance Size of sample, » 


Neyman allocation; sample-sizes 
ni fixed in advance 


THE PROPORTIONS P, KNOWN 
CLASSIFY ONLY THE n SAMPLING UNITS OF THE SAMPLE 


a 


Draw and classify a sample of d Size of sample, 
specified size n, which shall be ; 

also the final sample. The individ- E Ow y? or y! 
ual sample-sizes n¡ are random Cl e . =) +— (2) 
variables. w 


+ (cy + C3) (FRITW Y? 


Draw and classify a specified ta , Average size of the final sample, 
number n' of sampling units. Thin 2 
the strata by use of the Neyman | = »'- + Kn/v ' -= 12 TG 

, y y 1 Tu : TR 
ratios. The total sample n and the ñ=» ( ) + ( ) 
individual sample-size n¿ are all 
random variables. 
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THE PROPORTIONS P, KNOWN 
CLASSIFY ONLY ENOUGH SAMPLING UNITS TO FILL THE QUOTAS n, 


Fix the sample-sizes n; in advance 2 Total sample n and the quotas ni 
by proportionate allocation. Draw 4 , [ Tw y? as in Plan B 

sampling units and classify them + K (2) Variance the same as the variance 
until all the quotas n; are filled. ; $ : of plan B. The number n' of sampling 
n is fixed; also the n Note that n' in this plan | units that require classification will 


is not equal numerically YO | be, on the average, a bit bigger 
the n” in Plan E, nor to | than n 


he n* in Plan G. 


G Fix the sample-sizes n; in advance a dl Total sample n and the quotas ni 
by the Neyman allocation. Draw 2 as in Plan C. Variance, the same as 
sampling units and el fy them e Ly 2 the variance of Plan C. The number 
until all the quotas n; are filled. Ñ 2 n' of sampling units that require 
n is fixed. o la classification will be, on the average, 


a bit bigger than n/7. 


THE PROPORTIONS P, NOT KNOWN IN ADVANCE 
CLASSIFY A PRELIMINARY SAMPLE OF SIZE N” TO 
ESTIMATE THE PROPORTIONS P, 


H Classify the prelim nple N'e, 4 2 ] e e 
and thin all cl roporti Op N'= — 1 
ately to reach a specified final j S; Ca 
size n. The individual sampl = Ne +K 


sizes nj are random variables. Size of final 57 


pu 


I Classify the preliminary sample N'e - 

3 Eno 1 2 y gw e 

and thin the classes by the Ney- Opt N' == 24 A 
man ratios to reach a specified ob 


final size n. The individual sample- 
sizes are random variables, 


Size of final sample, 


Ela) 
+ (2)] 





EL PROBLEMA DE LA ESTRATIFICACIÓN 
ÓPTIMA* 


FoRE DALENIUS, Suecia ** 


SUMMARY 


The author specifies the four design operations involved 
in the use of stratified sampling and points out that optimum 


theory has been used only to guide design on the choice of 
size of the sample to be taken from each stratum. 


He deals with the cases in which the stratification is 
carried out (1) on the estimation variable and (2) on a specific 
stratification variable. He then discusses the problem of optimum 
stratification in the case of sampling without replacement from 
a finite population and finally deals with a special type of sample 
design which is of practical interest when sampling from a 
markedly skew population, e€e.g. when sampling business 
establishments in order to estimate retail trade, or sampling 
income earners in order to estimate mean income. 


INTRODUCCIÓN 


El uso del muestreo estratificado involucra cuatro operaciones de 
diseño: 


(1) la elección de un variable de estratificación; 
(2) la elección del número L de los estratos; 
(3) la determinación de la forma en la cual se ha de estratificar la población; y 


(4) la elección del tamaño de la muestra que debe tomarse de cada estrato, 
dados (1), (2) y (3). 


Mientras que en el diseño real de la encuesta, a veces se da un 
énfasis considerable a todos estos aspectos, la teoría óptima ha estado 
disponible para guiar el diseño (4) solamente. 


La situación puede ser descripta como sigue. En las funciones de la 
varianza y del costo que aparecen en la función de optimización 


= (1) + ALC (r) — C] (1) 


Nota Editorial: El Dr. Tore Dalenius ha autorizado a la Directora de Estadística para 
presentar la traducción en español de los capítulos 7 y 9Y de su tésis Sampling in Sweden: 
Contributions to the Methods and Theories of Sample Survey Practice, Almqvist y Wiksells, Uppsala, 
1957. Estos capítulos tratan de problemas metodológicos y prácticos relacionados con la utilización 
de encuestas por muestreo en Suecia. 


* Traducción del capítulo 7, “The Problem of Optimum Stratification.'” Este capítulo está 
basado, principalmente, en las tres disertaciones siguientes: (1) Dalenius, T., “The Problem of 
Optimum Stratification,”* Skandinavisk Aktuarietidskrift, 1950, pp. 203-213. (2) Dalenius, T. and 
Gurney, M., “The Problem of Optimum Stratification 11,” Skandinavisk Aktuarietidskrift, 1951, 
pp. 133-148. (3) Dalenius, T., “The Problem of Optimum Stratification in a Special Type of 
Design,” Skandinavisk Aktuarietidskrift, 1952, pp. 61-70. 


** Dirección General de Estadística, Estocolmo, Suecia 
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la única “variable de diseño” es n, el tamaño de la muestra en el estrato 
hmo. Pero 


8 la variable de estratificación, 
W,  €el tamaño relativo del hmo estrato, 
o (X,¡) etc., es decir, las varianzas en el hmo estrato, 
C, el costo (promedio) de efectuar una observación en el hmo 
estrato, y 


L el número de estratos; 


se suponen que han sido dados por anticipado. Simbólicamente, podemos 
decir que tratamos con 


0 (1) = 0* (m/s, Wa... D) 

á PA (2) 
Gu )= ( (NS, Y h» -- L) 

Sin embargo, W,,0(X,;), etc. son funciones del tipo de estratificación 


usada. En este capítulo, será tratado el problema de determinar la estra- 
tificación óptima. 


EL PLANTEO TÉCNICO 


En el capítulo 1 de mi libro* la presentación de los métodos y de 
las teorías de las encuestas por muestreo está basada sobre el muestreo de 
una población finita. Usando aquí lo propuesto en el mencionado capí- 
tulo 1 acabaría en complicada álgebra. Para que sea posible tratar el 
problema de modo más o menos sencillo, se utilizará aquí la teoría del 
muestreo de una población infinita. Además, la discusión se restringirá 
al muestreo en una etapa. 

De este modo, consideramos el muestreo estratificado de una pobla- 
ción hipotética representado por una función de frecuencias f(x), 
a=xK<Éb. Esta población puede ser convenientemente dividida en L 
estratos. El tamaño del hmo estrato está dado por 


mi / j(dE (3) 


Relacionaremos la discusión al problema de la estratificación óptima, 
cuando se desea estimar la media de la población. 


b 
po. f EJ(Hdi¿= LW, mn (4) 


donde 


1 Th y B 
Bn (E) d E (5) 


Y h Th ó 


1 Sampling in Sweden: Contributions to the Methods and Theories of Sample Survey Practice, 
Almqvist and Wiksells, Uppsala, 1957. 
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La teoría básica para el muestreo de esta población es bien conocida. 


Por muestreo aleatorio simple seleccionamos las n unidades de muestreo 


y usamos 
op 
— — TX; 
n ) 


para estimar 4. Este estimador tiene la varianza 
(7) 


2 >) 


mas ( 


b 
a = / EJE dE-w 
Y q 


el muestreo estratificado de n= n, unidades, cada n,>0 
h 


donde 
(8) 


Para 


utilizamos el estimador 
(9) 


y 


-, Ñ 
z - _W,z 
h 


que tiene la varianza 


donde 
(11) 


W, 
Según la forma en que se elija n,, la varianza toma diferentes formas. 


Afijación proporcional. Si n, = W,n, la varianza es 


2 Lo | ? : 
€ ZW, o 
Lo h 


Cprop 


(a) 
(12) 


— oro (T') 


Se puede demostrar que la ventaja de la afijación proporcional sobre el 
is , está dada por 


muestreo aleatorio simple, es decir, %as (2) 


ss La dde : 
3) = — Z Wi (i —.) 20 (13) 
n » 


) 


Omas (0) 
(b) Afijación de la varianza mínima. Si n, =— W, 0, la varianza 

es un mínimo y está dada por 
(14) 


NE 1 
, e E p A W Th 
h 


O min (2 ) n 
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Puede asimismo demostrarse que 


o de 9 de 1 . 5 2 ] > aid 
Omas (x') — Omin (x”) A 2. Y h (Mn 3% u)” + O de Y h (0, E a) 


N h n » 


donde 


¿= LW, 0, (16) 
h 


Es obvio que — Y W, (0, — 3)” mide la ganancia de la afijación de la 
nn » 


varianza mínima sobre la afijación proporcional. 


(c) Afijación óptima. Si el tamaño de la muestra está limitado por 


requerirse que C'(2')=C, donde C(<') = Z C,n, la varianza será un mí- 
h 
. Ó > / nm Al 
nimo si n,  W,0,/ WC, - Entonces 


(17) 


Es obvio, que para C¡=...=C,==...=C;, la afijación óptima 
es idéntica a la afijación de la varianza mínima. 

En las siguientes secciones, se utilizarán estos procedimientos como 
base para la discusión. En la sección 3, el problema de la estratificación 
Óptima está examinado en la forma desarrollada originariamente en la 
primera de las tres disertaciones a las que se hizo referencia al comienzo 
de este capítulo; también se hace uso del segundo de estos trabajos. En 
la sección 4, que se basa en el segundo trabajo, se introduce una variable 
específica de estratificación. En las secciones 5 y 6 se discute el muestreo 
de una población finita. Finalmente, en la sección 7 se discute la aplica- 
bilidad de los resultados dados en este trabajo. 


LA ESTRATIFICACIÓN SE REALIZA SOBRE LA 
VARIABLE DE ESTIMACIÓN 


Suponemos que la población f(%), a: £1<b, está estratificada en 
L estratos, por L-—1 puntos de estratificación (%,=4), T,,T2 ..., 
Th ---» Tr 1 (1, =b) en el intervalo a, b. Para L=2, el punto de estra- 
tificación será simbolizado por 1,= 7. 

De este modo, la estratificación se realiza sobre la variable de estima- 
ción. En la práctica, se trata de utilizar como variable de estratificación 
aquella que está linealmente relacionada con la variable de estimación; 
cuanto más alta es la correlación, mejor resulta la variable de estratifica- 
ción. Aunque los resultados obtenidos son formalmente exactos, desde 
el punto de vista de la aplicación son aproximados. 
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(a) Para la afijación proporcional, es óptimo el conjunto de puntos 
de estratificación 2;, Lo, ..., 11 que hace de 


i 1 a 
T, op (x po sun as le Y h 5)» 
n h 


un mínimo. Para simplificar la escritura trataremos con 


Pprop 1: y La, «y UL 1) . Obrop nen dl M h TF) 
h 


y 


| É 
Aprop (E) == — E Wa (ua — 1) 
h 


Amro (L;, 2 , TL-:) = Aprop = E W, (1 — 1) = 2 Aprop (7) (21) 
h 


f 
prop "ly Y. y 


Es obvio que el conjunto de puntos de estratificación 2,, La, ...,LL1, 
que hace de a”), op (2) un mínimum, hace a Aprop (4) máximo. Es ahora 
evidente cómo se puede tratar el problema de la estratificación óptima 
para la afijación proporcional. 


El caso L= 2. Empezando con el caso simple de L —2 tenemos 


prop -. W, 0 + Wa 0 (22) 


fre as| 
-w, ) 


Pesos 
fiar 


con una fórmula análoga para 0. 


donde 


0; = 


d O; W, + d y 9 E + d O5> 


1 T dx 


A Y A 
> > a A 
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d W; 
dx 


o 


d UN 


dx 


d Wa, 


dx 


d $ € o 
2 2 21 

e =>. lx ds , 
de o” 12), 


d Oprop 
dy 


= $ (2) ll — un)? — (2 — uo)?) 


Póprop/ dx = 0 tiene la misma solución que 


z b 
illa A fesoar fsvar| 


2 A RN 
fra: fivar | 


que es el punto de estratificación óptima (siempre que se cumplan las 
condiciones usuales para un mínimo). 


4 (27) 


Naturalmente, el maximizar A prop da la misma solución. 


Para las poblaciones representadas por funciones? de frecuencias 
bastante simples, el punto óptimo de la estratificación puede hallarse 
por medio de un procedimiento iterativo. Comenzando con un valor apro- 


. . , , 9 . . 
ximado zx se calculan las medias, 4, y M, de los estratos así definidos. 

Y , , d . ia 
Ahora, si $ (4, + 1,) >, el valor aproximado x es demasiado pequeño, 
y recíprocamente. 


Este procedimiento se ha llevado a cabo con la población especial 
f(x) = €*,0< q. Los cálculos están dados en el cuadro 1. 


2 


2 El profesor Walter D. Fisher de la Universidad del Estado de Kansas, me ha señalado 
que la condición x = Y2 (M1 + M2) es necesaria pero no suficiente. Por ejemplo, para las funciones 
multimodales, puede haber más de un punto T— Y (Mi + M2). De modo que, en tales casos, 
es necesaria comparar 0%prop (7') para cada uno de tales puntos, a fin de hallar el “mínimo 
absoluto”. 
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CUADRO 1. CALCULANDO LA ESTRATIFICACIÓN ÓPTIMA, L=2PARA LA 
POBLACIÓN f (1) = e” 


1 , 
o (a + Mz) 


- 


pudo ju 
So 


na e Y y dy 
vo um nn a y dy 


ESE: RSY 
AAAMA le VVV VVNV 


e 
O 


vo a 
o 


fu no po poo po on ps Y) 
mo de 
a 
MO 2 to po io pudo pudo ud 


QQ 00 tn 


o 


De este cuadro resulta evidente que el punto óptimo de estratifica- 
ción, con una sola cifra decimal, es x= 1,6. 

Se eligió este ejemplo con el propósito de suministrar una ilustración. 
Para la población utilizada en el ejemplo, es posible deducir el óptimo 
sustituyendo directamente las expresiones propias de 4, y 4, en la ecuación 


l 


... (1 + 4) (28) 


o... o .» 3 . 
y resolviéndola. Esto conduce a la ecuación e” + e 1 =0, que tiene 


la raíz x = 1,593. 
Si se desea estudiar como 0,0, (1) depende de la elección del punto 
de estratificación, es sólo necesario trazar la curva 
2 = le 18 els 
nN Oorop (7) = Y 1 91 + Y 2 02 (29) 
para los diferentes valores de z. 


A modo de ilustración consideramos la población f (1)=e*, 0£zx, 
que se representa en la Figura la. 

f(x) 

1w 


FIGURA la. LA POBLACIÓN f (1) =e* 
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Para esta población 


, 


Z re 
N Gprop[U ) = 1 


Su curva está representada en la Figura 1b. 


2 y 
” O rop (* ) 


- 


FIGURA lb. nof,,, (24) COMO FUNCIÓN DEL PUNTO DE ESTRATIFICACIÓN 


El caso general. El problema de la estratificación óptima para la 
afijación proporcional se resuelve con facilidad teóricamente para el caso 
general de los estratos L, es decir, L— 1 puntos de estratificación. 


Observamos que W,, M, y 0; son funciones de %,, Y Y), Solamente. 


Ahora 
Boro = WA +... FW 0+...+W,o, (31) 
Vb»  0W, 2, 90 is si 


== . — 0 W . SS e O W Lo e 2 
92, a UTA ME +1 (6 


Aquí 


y o, S o o 
] - Y e $ (x,) Lx, . Mn)” > 0.) 


ox h 


0 W, + 1 


$ (x,) 


Wr+r= J (xa) Lo, a a y 
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De este modo obtenemos 


O b, op 
0X, 


= $ (2,) | (2, Mn)” (2, ld 57 


Tenemos, para h=1,2,...,L, las ecuaciones simultáneas 


ESE) dE 
(35) 
h 
$ (8) dé 
Fh-1 
como las soluciones de las ecuaciones 064 prop Ox 0. Alternativamente, 
podemos comenzar con A prop = EW, (4, — MY. 


h 
El conjunto óptimo de los puntos de estratificación tiene que sel 


determinado por medio de un procedimiento iterativo, tal como se demos- 
tró antes para el caso L=2. 

(b) Para la afijación de la varianza mínima, el problema de la estra- 
tificación óptima puede obviamente ser tratado por método paralelo al 
explicado antes; pero la afijación de la varianza mínima ofrece mayores 
dificultades debido, principalmente, a la aparición de o, es decir, a la raíz 
cuadrada de 0; en las expresiones pertinentes. 

Usemos 


' l 


n 


min (1) = =| ZW, 0) 
h 


y busquemos el conjunto de puntos de estratificación que hace de 
un mínimo. Este mismo conjunto también hace de 


da Pmin (7; . Eh LL 1) -. Ómin es ps M h Th 
un minimo. h 


Esto es equivalente, pero más sencillo, que maximiza! 
AminlEr La. Zo) = Amia = EWili—1)*+ E W,(0,-—7* (38) 
h h 


Comenzando con gmin, el conjunto óptimo de puntos de estratificación 
se halla como la solución de dómin/dx, = 0. 


El caso L=— 2. Tomando el caso más sencillo, L — 2 tenemos 
Ómin > W,; g| + Wa 0) 


d min dW, De dW, O 
ds PR A Y —— q, + W, 
de E ATA ' 


dx dx dx 


o loa+!(z y” a+(z y 
Jl | a) _ SE) (40) 
€ 
2 - d1 Ta 
Ahora, la estratificación Óptima está dada por aquel punto para la cual 
2 (a y a+(s-— a) 
SIS] ATA (41) 


d1 Ta 
(o el mínimo absoluto, si no hay una solución única). 
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Para las poblaciones f (1) simétricas alrededor de la media 4, la solución 
para el caso L —2 es obviamente x =4. Un ejemplo trivial está suminis- 
trado por la población rectangular f(1)=1,0<x <1. Entonces, 


1 9 
E [2 + (1-27] (42) 


l E ús 
dando x = q omo el punto óptimo de la solución. 


Consideramos la población f(x) =x e", 0Ézx que está representada 
en la Figura 2a. 


J (x) 


1 3 su $ 6 
FIGURA 2a. LA POBLACION f (2) = ze* 


- -. 2 2 , 
En la Figura 2b, tanto N Gain (7) COMO N Gpo) (2) están representadas 
¿ S Sl radas. 
ara las poblaciones considerada 


0 ' “ 3 $ 


FIGURA 2b. NO nop (2) Y Ngnin (2) COMO FUNCIONES DEL PUNTO DE 
ESTRATIFICACIÓN 
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El caso general. La solución general del problema de la estratifica- 
ción óptima como una afijación de la varianza mínima se obtiene resol- 
viendo las ecuaciones simultáneas 


o o o o 
5» + (x, ne 1779) _ Oh+ 1 + (2, — li 1) 
Th Oh + 1 


(43) 


Es evidente, que aún para L=3 o 4, este procedimiento resulta 
molesto. 


(c) Para la afijación óptima la varianza está dada por 


o 


1 , Pon 
Oops (E e e L W,o, WC, (44) 
( h 
Claramente es mejor aquella estratificación que hace a € 0; (2') mínima. 
Pero esta estratificación también hace a 
Í 
Popt 5 =2 W h Th vC, h (45) 
mínima. En el caso de 2 estratos, tenemos 
, Pa , mm AR 
Popt . Y 1 9] vV C; +) Y 2 02 v ( 2 (46) 
Suponemos que C,, el costo promedio para efectuar una observación 


en el primer estrato, y Ca, definido similarmente para el segundo estrato, 
son funciones de x . Entonces 


1 
C, +, g(E)Í (E) dé 
1 a 


Ahora 


1 b 
Loros 
dC, 


dé A opt (W,, 01) dx 
> VO, —AL TE VW, 0 ——= 
dx =2 , da - eo” 2vC, 
Aquí d (W, 0,) / dx es conocida por la discusión anterior. Además 


dC, _ dW, (5) + 010 .. J (x) lg(x) —C,) 
dz dx W; W,; W; 


e 


d C, de JA) J 
dx We 9 
La sustitución de estos valores en dep: /dx da 
d Popt 2% Í (x) [va 0 + (x Z un)" 
dx 2 


19 (x) — Co] 


- VCa 
9] 
W 1 á W, 0: 
Fa L tg) -0)- Ya 


vC, VW, VC, 
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El punto de estratificación óptima está dado por aquella x que satis- 
face la relación 


gía) +Ci(x AT yn +Ca (1—u) 


a IA A (51 ) 
“C, UN v Cs 0) 
Para un costo constante en el intervalo a ÉHx <b, esta expresión es 
idéntica a la expresión para la estratificación óptima tal como se da para 
una afijación de la varianza mínima. 


LA ESTRATIFICACIÓN SE REALIZA SOBRE UNA 
VARIABLE ESPECÍFICA DE ESTRATIFICACIÓN 


Como anteriormente, representamos a la población por una función 
de frecuencias f (1), cuya media 4 queremos estimar. Designamos por s 
la variable sobre la cual se realiza la estratificación. 

Supongamos que la variable de estimación x y la variable de estratifi- 
cación s están vinculadas por la relación 


a=yY(s)+.0"2 


donde 7, es la desviación aleatoria de x de la línea de regresión X = Y (8), 
E (n,) =0. 

Es obvio, que og” (y correspondientemente 0, para cualquier estrato) 
puede determinarse en función de yY(s) y 7, Los resultados dados en la 
sección 3 para e! caso en que la variable de estratificación es idéntica a 
la variable de estimación, pueden ser considerados como casos especiales 
en este problema. Al tratar el problema de la estratificación óptima en 
esta forma, obtenemos los siguientes resultados, más generales, para el 
caso de L — 2 estratos.? 


(a) Para la afijación proporcional 


Y. (s) + y (s) 


(8) = 
' 2 


b bara la afijación de la varianza minima 
] 


Y 5 + Ls 


CF +0 (m+ il) —y (s) )' Pa 
Y bs + %n 


3 Para simplificar, trataremos solamente el caso de 2 estratos 


2 La generalización para cualquier 
número de estratos es directa. 
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donde y, (s) y Ya(s) son los valores medios de Ys) en el primer y en el 
segundo estrato respectivamente, dy), y), 01 n Y 0n Son las varianzas 


de yY(s) y n, en estos estratos y gd, (n) es la varianza de y, en el punto s 
de estratificación óptima. 


En la práctica, se trata de utilizar como variable de estratificación 
aquella que esté relacionada linealmente con la variable de estratificación . 
Suponemos que tenemos 


a+ Bs +9 
y además que 


= () para todo s 


= y para todo s 
En este caso 


Y (s) = a+ Bu,,, etc. 
CY + %s = $ ñ, + y, etc. 


o, n = y 


Entonces la estratificación óptima está dada por 


(a) para la afijación proporcional 


a+ Bu, + a+ Bu». 
o 


- 


a+ Bs = 


donde es 


MT a 
5 


(b) para la afijación de la varianza mínima 


, 


PAHO + Als do 24) 
Vo, + y 


La extensión a casos donde £ (ní) Ss, ys, etc. es directa. 


LA ESTRATIFICACIÓN ÓPTIMA CUANDO EL MUESTREO 
SE EFECTÚA EN UNA POBLACIÓN FINITA 


La discusión del problema de la estratificación óptima, se ha limitado, 
hasta ahora, al muestreo en las poblaciones infinitas, representadas por 
una función de frecuencias f (1). De este modo ha sido posible olvidar la 
influencia del “factor de corrección de la población finita” en la determi- 
nación del punto de estratificación óptima. Aquí se tratará de las impli- 
caciones del muestreo sin reemplazo, de una población finita de tamaño N. 
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Para aquellas poblaciones cuyas distribuciones de frecuencias pueden, 
con suficiente exactitud, ser representadas * por una función de frecuen- 
cias f (2), el problema puede ser investigado en la siguiente forma: 

Cuando se muestrea en una población finita de tamaño N, utilizando 
una afijación de la varianza mínima, la varianza del estimador lineal 
7 = E W, 7”, de la media de la población 4 puede ser escrita 

h 


, 1 O + 
min (x') E Z Y h 07) e. r ¿> Y h 0) 
N h N h 


usando la aproximación 
N eE 1 
N» 
(Esta aproximación es equivalente a la transformación 
N» 
N,—1 


0 (63) 


y2 
Sy = 


utilizada en algunos textos.) 

El último término en la expresión de la varianza mide la ganancia 
debida al muestreo de una población finita. Este término también ejerce 
influencia sobre la determinación de la estratificación óptima. La estra- 
tificación Óptima para L =2 estratos es aquel punto x para el cual 


n 
N 


es un mínimo. Este mínimo es aquel punto x para el cual d¿..¡/ dx = 0 
(cuando se cumple con la condición usual para el mínimo). 


Si escribimos 


min = (W,0, + Wa 0): — (W, 01 + W, 03) (64) 


(65) 


entonces 


(66) 


Las expresiones para dA/dx y dB/dx han sido dadas anteriormente en 
este capítulo. Obtenemos 


2 


d bm 2910) AH _ a+ (a) 
dx 7 01 92 


n 


FA Lou) (2 )]i (67) 


4 El efecto de la discontinuidad mo se toma en cuenta en lo que sigue 
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Entonces d $min/dx = 0 da la raíz x que satislace la relación siguiente 


n 


W, e y A O; + Wa O) 


sde e o (W, (8 + W> 02) 


' n , 
(w. E) 0 + Wo 


O) Y —_—_—_——_—_——_—_—_—_— (1 — Mo) (68) 
as (MU 1 91 + Y 9 05) 

que obviamente para n/N = 0 da el resultado presentado anteriormente .* 
Es difícil hacer una declaración general sobre el efecto del factor de 
corrección de la población finita. Sin embargo, se han investigado algunos 
casos que serán tratados a continuación. Ellos son consistentes con el 
sentido intuitivo de que este efecto sobre la determinación del óptimo 
debería ser despreciable en casi todos los casos prácticos; como es a menudo 
el caso con las soluciones óptimas en el muestreo, las desviaciones leves 

del valor óptimo absoluto casi no tienen importancia práctica. 


Caso I. La población está representada por la función de frecuencias 
f (1) = e, 0 <zx. Entonces en el caso de 2 estratos 


O -212_ NM - m 
bin = [VW (1=e"P=22e7* +e*)?- dl -——) (0) 
¿ e 


Para n/N =0,0; 0,2; 0,4 se muestran las curvas en la Figura 3. 


Debe notarse que el punto óptimo de la estratificación se mueve hacia 
la izquierda a medida que aumenta n/N, pero tan despacio (y el mínimo 
es tan ancho) que la estratificación óptima para una muestra que tiene 
el 40 porciento de la población no es muy diferente del caso infinito 
(que corresponde a n/N —0). 


5 Las expresiones dadas aquí para dA/dz y dB/dzpueden ser utilizadas para la determinación 


del punto z para el cual la ganancia G, lograda por la utilización de la afijación de la varianza 
mínima en comparación con la afijación proporcional, es máxima. Tenemos en el caso finito. 


SN qa as) 
Qu Torop (E min Z) 


l a 1 1 2 1 > o 
= [22 W»0% - —Y wnoh ]-[ (2 W»0») =-—2 Wno, | 
nh Nh n h N ñ 


1 2 2 
= [2 W10h — W»0») ] 
n h h 


1 pan » 
pa «e z Wr(0r— 7)? (69) 


que también mide la ganancia en el caso infinito. Entonces la solución de d(nG)/dx=0 da el 
punto z para el cual G es un máximo. 
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Gaso PE La población está representada por la función de frecuen 
cias f(1) = 2 (1 2) 0<zx Il. Entonces 


na (6-6x+4) dd 
A : 2. Y —_——_——áée llo 
E Vó6—br+r?*+(1 1) y A 2—x 


18 18 


Omin .. 
(71) 
$min €s de forma similar a las curvas correspondientes en la Figura 3. 


Caso 111. La población está representada por la función de frecuen- 
cias f (1)=1, 0<zx Il. Entonces 


Ómin > 12 [le $ (1 - x)*y” E + [q + (1 x) | 


Nuevamente, min es de forma similar a las curvas correspondientes 
en la Figura 3. 

Mientras que la aproximación utilizada aquí para estudiar la influencia 
de la corrección de la población finita sobre la determinación de la estra- 
tificación óptima, parece ser de valor práctico si la fracción de mues- 
treo n/N es grande puede surgir un problema al aplicarlo. En tal caso, 
la fórmula para la afijación de la varianza mínima de la muestra puede 
dar valores para n, que sean mayores que los valores de N,. La utilización 
de tales valores n, introduce una contribución negativa a di, (2) y puede 
ser la causa de que $; resulte negativo. Esto, claro está, es un resultado 
puramente formal. Cuando en la práctica surja tal situación, generalmente 
se hace n, = N, para el estrato en el cual la fórmula requiere que n, sea 
mayor que N, y reafija el saldo de la muestra a los estratos remanentes, 
utilizando entonces el principio de la afijación de la varianza mínima. 
En ninguno de los ejemplos tratados aquí tenemos n, > N,, si la fracción 
general del muestreo está restringida a menos del 70 por ciento. 


6. EL PROBLEMA DE LA ESTRATIFICACIÓN ÓPTIMA EN UN DISEÑO 
DE TIPO ESPECIAL 


En esta sección, se considerará un tipo especial de diseño de muestras: 


(1) La población se divide únicamente en L — 2 estratos. El primer estrato 


contiene N, unidades (de muestreo) y el segundo estrato N, unidades, N, + N¿=N. 
(2) Se extrae una muestra de n unidades seleccionando todas las unidades del 


segundo estrato, es decir, haciendo n, = N, y afijando n — N¿ = n, unidades al primer 
extrato. 


El problema de la estratificación óptima es obviamente equivalente 
al problema de la determinación del punto de intersección, arriba del 
cual, todas las unidades de muestreo son seleccionadas con certeza. 
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Este tipo de diseño es de interés práctico cuando se muestrea de 
una población marcadamente asimétrica, por ejemplo, cuando se mues- 
trean establecimientos comerciales para estimar las ventas al por menor, 
o cuando se muestrean personas que devengan ingresos con el fin de estimar 
el ingreso medio. 


Discusión general 


Presentaremos aquí un tratamiento general del problema. 


Como antes, la población será representada por una función de fre- 
cuencias f (1). El tamaño total y la media de la población son 


b 
w fsiar=w 
b . 
sf ioá 


Un punto z en el intervalo a, b divide a la población en dos estratos de 
tamaños 


(73) 


O, $ 19 de (74) 


N=N-—N, (75) 
y con medias 4, y 42 respectivamente. Resulta claro que 
y =W, u + Wan (76) 
donde W,=N,/N y W2=1-— W,. 


Utilizando el tipo especial de diseño caracterizado por n,<N,, n2 = Na 
estimamos K. por 


7 =W,3, + Wa no 77) 


Para la varianza tenemos 


2 - y2 _2(=, - 
Tes (7) = Wi o (21) (78) 
Usando la técnica desarrollada en este capítulo, hallamos el punto 
, . eo .. . 2 o 
óptimo de la estratificación x, es decir, aquel punto para el cual  g,,, (27) 
.. . . 2 2. . 
es mínima, diferenciando o, (1”) con respecto a 1. De este modo (siempre 
que se cumplan las condiciones usuales para un mínimo), la solución de 


d 2 y d y2 4 => y ” 
a mo (== (Wo (39) q. (79) 


representará la solución. 
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Ahora 
, 2 
2 2 /= 2 Ni-=MN1 06 
Wo) = W —_———— — 
Ni—-1 mn 
La diferenciación se simplifica si introducimos la aproximación 
N, o de N, _.. ny 
N 1 SS l N 1 
y posteriormente hacemos uso de las identidades 
N, =W,N | 
N, = WN 
n, =n=-n=n-—No=n-—W.N | 
Entonces 


¡N—n+W,N 


2 
esp (Y 7) = 


Es obvio que d;,, (1') tiene el mínimo para el mismo z que 
y 2 y 2 
y r O; N 1 Os 
Pesp eS 


n Ny 


— — ] Wi; 
N $ 


n d 
— —]1 W,)— (W 
Y (5 , Ji 5) 


de 


d 


— (W, 0%) = W, E A, = o—u) —0 1 + 01 f(x) 


. f(x) (xr — uy)" 


LE (H-1+w,) =30 


ds dóesp/ de = 0 resulta 


(+ -1+W 10 (2— uy) —W, 0 f(x) =0 


llegando a la siguiente condición para la estratificación óptima: 


9 W, 0% 
(x == m)= — 26 = dep 


n 


— — 1] W, 
N ha 
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Este resultado será aplicado a tres poblaciones asimétricas para de- 
mostrar la relación entre la varianza de z' y la elección del punto de 
estratificación 1. Además, compararemos la varianza de 7” para el tipo 
especial de diseño que estamos considerando aquí, con la varianza lograda 
al hacer n, =— W, 0, para L — 2 estratos; para esta varianza utilizamos, 


, 


como antes, o,,,, (1). Ahora 
W, o? 


1+VW, 


sd > E n SO 
N Omin (7) = (z W, 0) - —+XIV, 2% 
h N 


y así las dos expresiones para las varianzas están dadas de modo que facilita 
las comparaciones. 
Caso IV. La población está representada por f(1)=e*, 0< zx. 
Los puntos exactos de estratificación óptima para el diseño de tipo 


especial y las varianzas asociadas n o;,, (2') están dados en el Cuadro 2. 


CUADRO 2. ESTRATIFICACIÓN ÓPTIMA PARA LAS DIFERENTES 
RAZONES n/N 


T 


2,1490 0,3849 
3,8005 0,7503 
5,3302 0,9014 
5,9031 0,9292 
6,7185 0,9543 
8,0503 0,9750 

11,998 0,9897 


9 


En el Cuadro 3, se comparan 2 din (2) y n sp (2') para diferentes 
razones de n/N y para diferentes valores de z. 

Es instructivo estudiar n sp (2) como una función de x. Hasta cierto 
punto esto puede hacerse analizando el Cuadro 3. Resulta sin embargo, 
más ilustrativo trazar los gráficos para n 0iyin (2/) y n 0%, (2') para por ejem- 
plo, n/N = 0,25. 

El Cuadro 3 demuestra el hecho de que el diseño de tipo especial 
aquí considerado es muy ineficiente en comparación con el diseño de la 
varianza mínima cuando n/N es pequeño. Aunque este resultado es dis- 
cutido aquí para la población f (+) = e”, conjeturo que es de aplicación 
más bien general. 
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CUADRO 3. COMPARACIONES DE ne?) y ne. (1) PARA LAS 


min A” d esp |- 
DIFERENTES RAZONES n/N Y LOS DIFERENTES VALORES DE z PARA f (1) = e* 


0,25 0,10 0,01 


0,1935 
0,2541 0,3901 0,3102 
0,3923 0,4483 0,4716 | 0,8579 
0,5256 0,5529 0,6308 | 0,7527 
0,6228 | 0,6349 0,7443 0,7949 0,8221 2,500 
0,8195 0,8380 0,9014 | 1,195 
0,8598 0,8668 0,9457 1,040 
0,9687 1,002 
0,9801 0,9922 
0,9855 0,9900 
0,9880 | 0,9896 
0,9891 | 0,9897 
0,9896 | 0,9898 


Caso V. La población está representada por [¡(1)=xe*, 0<x, 


Los puntos de estratificación óptima para el diseño de tipo especial 
y las varianzas asociadas son: 


CUADRO 4. ESTRATIFICACIÓN ÓPTIMA PARA DIFERENTES RAZONES n/N 


n/N 


0,25 3,98 0,9979 
0,10 6,19 1,6431 
0,05 8,24 1,8627 
0,04 9,02 1,8994 
0,03 10,14 1,9314 
0,02 11,99 1,9581 
0,01 16,14 1,9800 


En el Cuadro 5, se comparan A din (1') y N 0) (2) para diferentes 
razones de n/N y diferentes valores de z. 


El Cuadro 5 demuestra también la conclusión de que el diseño de 
tipo especial es más bien comparativamente ineficiente para las razones 
n/N pequeñas. 


Caso VI. La población está representada por una distribución de 
ingresos. Se ha supuesto: que los ingresos de hasta 8.000 tienen una dis- 
tribución rectangular; que los ingresos superiores a 8.000 obedecen a la 
distribución de Pareto; los ingresos supericres a 1.000.000 no han sido 
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considerados. Para facilitar los cálculos, la unidad de cálculos es 8.000; 
zx simboliza aquí a esta variable. De modo que la población estudiada es: 


o 0<x<1 
f(x) = (89) 
7 ie 
CUADRO 5. COMPARACIONES de noz yn (2) y Gp (E) PARA DIFERENTES 
RAZONES n/N Y DIFERENTES VALORES z DE f(z = (e* 


0,01 


no? ix”) 


min 


0,5242 | 1,677 | 
0,7224 0,9979 9,010 
0,9514 | 1,088 1,837 
1,150 1,218 1,645 
1,293 | 1,325 1,665 1,707 6,278 
| 1,711 1,828 2,614 

1,747 1,900 | 2,166 
1,939 2,040 

1,960 2,000 

1,970 1,986 

1,975 1,982 

1,978 | 1,980 

| 1,980 

1,980 


ED A 


0 -=J 








Los puntos de estratificación óptima para el tipo especial de diseño 
y las varianzas asociadas están dados en el Cuadro 6. 


CUADRO 6. ESTRATIFICACIÓN ÓPTIMA PARA DIFERENTES RAZONES n/N 


n/N N Tógp (1) 


0,25 8,2 7,6 
0,10 31,6 70,3 
0,05 66,8 179,1 
0,04 80,6 214,2 
0,03 99,1 249,2 


En el Cuadro 7,N Omin(T') y N 0%p(17') Se comparan para diferentes ra- 
zones n/N y diferentes valores de zx. 

El Cuadro 7 confirma las conclusiones de los Cuadros 3 y 5: la pérdida 
de la eficiencia ocasionada por el uso del diseño de tipo especial en vez 
del diseño de la varianza mínima obtenida al hacer n, proporcional a 
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W, 7, es baja para valores grandes de n/N pero es alta para valores pe- 
queños de n/N. Por lo tanto, el uso del diseño de tipo especial debería 
limitarse a aquellos casos en los que n/N es “grande” y la simplificación 
en los procedimientos administrativos tenga mucha importancia. 

En otros casos, el mejor diseño práctico puede ser la utilización de 
L = 3 estratos, haciendo n¿= Ny, y afijando n, y nz al primer y segundo 
estratos en proporción a N, y Na respectivamente. 

La estratificación Óptima para este tipo más general de diseño, puede 
ser hallada por medio de la técnica desarrollada en este capítulo. 


mi 


RENTES RAZONES n/N Y DIFERENTES VALORES DE z PARA 
a virts 
fix)= 


CUADRO 7. COMPARACIONES ENTRE no? . (2) y na, (7) PARA DIFE- 


axrti1l<xr< 125 


81,47 
70,69 
71,46 
75,85 


81.99 


de LA APLICABILIDAD DE LOS RESULTADOS PREVIOS 


Los resultados de este capítulo han sido aplicados en el diseño de 
encuestas específicas; para ilustración, se hace referencia a Strecker (1957), 
Thionet (1955) y Wirth et al. (1956), entre otros. 

En general, los resultados deberían probar su aplicabilidad, principal- 
mente, al muestreo de poblaciones marcadamente asimétricas. Los siguien- 


tes ejemplos del uso potencial de los resultados están dados de la práctica 
sueca en encuestas por muestreo: 


(a) la encuesta anual de superficies etc., presentada en el capítulo 3 de mi libro; * 
(b) la encuesta trimestral del movimiento de ventas al por menor; y 
(c) las estadísticas de los ingresos. 


Como demostrara Zindler (1956), la estratificación óptima también 
puede ser valedera cuando se muestrea una población simétrica. 


8  Dalenius, op. cit. 
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EL MUESTREO ESTRATIFICADO 
MULTIPARAMETRICO* 


"TORE DALENIUS, Suecia ** 


SUMMARY 


Sample survey theories are to a large extent concerned 
with the problem of estimating one specific parameter, i.e. the 
uniparametric case. Sample survey practice, however, is almost 
exclusively concerned with the problem of estimating several 
parameters, i.e. the multiparametric case. It is not uncommon 
that these parameters make conflicting demands on the design: 


A procedure that is likely to decrease the variance of the 
estimator of one parameter may well increase the variance of 
the estimator of some other parameter. 


The purpose of the paper is (1) to throw some lighi on 
this conflict when applying stratified sampling, (2) to review 
different procedures proposed by other authors, and (3) to 
present some proposals for the way of dealing with the conflict 
which were originally developed by the present author. 


INTRODUCCIÓN 


Las teorías de encuestas por muestreo se interesan, en considerable 
proporción, por el problema de la estimación de un parámetro específico, 
es decir, del caso uniparamétrico. Sin embargo, en la práctica, las encuestas 
por muestreo se ocupan, casi exclusivamente, del problema de la estimación 
de varios parámetros, es decir, del caso multiparamétrico. No es raro que 
estos parámetros exijan requerimientos contradictorios sobre el diseño: un 
procedimiento que es apto para disminuir la varianza del estimador de un 
parámetro puede muy bien aumentar la varianza del estimador de algún 
otro parámetro. 


El propósito del presente trabajo es (1) arrojar luz sobre este conflicto 
cuando se aplica el muestreo estratificado, (2) rever diferentes procedimien- 
tos propuestos por otros autores, y (3) presentar algunas propuestas sobre 
la forma de abordar el conflicto, que originariamente fueron desarrolladas 
por mí. 


Nota Editorial: El Dr. Tore Dalenius ha autorizado a la Directora de Estadística para 
presentar la traducción en español de los capítulos 7 y Y de su tésis Sampling in Sweden: 
Contributions to the Methods and Theories of Sample Survey Practice, Almqvist y Wiksells, Uppsala, 
1957. Estos capítulos tratan de problemas metodológicos y prácticos relacionados con la utilización 
de encuestas por muestreo en Suecia. 


* Traducción del capítulo 9, “Multiparametric Stratified Sampling.” Este capítulo está 


basado en “The Multivariate Sampling Problem,” Skandinavisk Aktuarietidskrift, 1953, pp. 92-102. 


** Dirección General de Estadística, Estocolmo, Suecia. 
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2. LA NATURALEZA DEL CONFLICTO 


Consideremos el egos caso especial de la teoría presentada en 
el capítulo 1 de mi libro.* Una población formada por L subpoblaciones, 
está caracterizada por los parámetros A dc ES donde 


X = y W,X, (1) 


h 
con fórmulas análogas para Z, etc. 
El estimador lineal 


L ; 
= LW, 2, = E W, — Y Uri 
h 


UN J 


d ; Je L 
tiene una varianza minima para una muestra total fija y N, =N 


h 
S1 


W, o(X a) 
E W h 5 X 1) 


1. 


Es obvio, que la distribución así determinada corresponde solamente 
a la varianza mínima para el estimador lineal z' definido antes por el 


parámetro X. No corresponde, necesariamente, a la varianza mínima de, 


por ejemplo, una razón del estimador de X o para cualquier estimador de 
los otros parámetros involucrados. 


En una encuesta real, generalmente se encontrará que un modelo de 
afijación que es favorable para la estimación de X no es necesariamente 
efectivo, por ejemplo, para la estimación de Z. En el capítulo 3 de mi 
libro,? se da el siguiente ejemplo. Una muestra de 1.000 fincas debió 
ser afijada para estratos de cuatro tamaños. Las diferentes formas de 
afijación de las 1.000 fincas en el estrato fueron comparadas en el Cuadro 1. 

Es obvio, según este cuadro, que hay un conflicto entre los requerimien- 
tos de los diferentes parámetros sobre el diseño; la afijación de la varianza 
mínima para la cebada, por ejemplo, es marcadamente diferente a la 
varianza de la papa. La cuestión que se suscita es, naturalmente, cómo 
determinar n,. 


Es muy claro que el conflicto no se limita al aspecto de la afijación. 
El afecta también a otros aspectos del diseño, especialmente a la elección 
de la variable de estratificación y a la forma de estratificar la población. 

En este capítulo, la discusión se limitará a la forma de la afijación. 


1 Sampling in Sweden. Contributions to the Methods and Theories of Sample Survey Practice, 


Almqvist and Wiksells, Uppsala, 1957 
2 Ibid 
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CUADRO 1. COMPARACIÓN DE LAS DIFERENTES FORMAS DE AFIJACIÓN 
DE 1.000 FINCAS 


Propor- Afijación de la varianza mínima 
ción basada sobre datos de: 

Clase de la 
por 'antidac |Afijaciór| super- 
tamaño de propor- | fície 
(hectá- fincas | cional | prome- 

reas) dio 
(hectá- 

reas) 


Trigo | Centeno 


de | de Cebada | Avena | | Heno 
Invier- | Invier- | 


19 
<0 — 49 
50 149 y 313 


150 y más 1: 7 156 











Tota! de ficas y 1.000 1.000 | 1.000 | 1 1.000 


3. EXAMEN DE LA LITERATURA 


Neyman (1934) trató brevemente el problema de este capítulo. Señaló 
que las varianzas de las diferentes variables están positivamente correla- 
cionadas si las variables mismas están positivamente correlacionadas. 
Entonces, la afijación de la varianza mínima con respecto a una variable 
será razonablemente buena para todas las variables. Si las diferentes varia- 
bles no están altamente correlacionadas, entonces (+bid., p. 581), “Lo mejor 


que podemos hacer es muestrear proporcionalmente a los tamaños de los 
estratos.” 


En la misma reunión de la Sociedad Real de Estadística donde Neyman 
presentó su trabajo en 1934, Bowley hizo el siguiente comentario (Neyman, 
1934, p. 608): 


“Un nuevo punto que surge en el trabajo es que una selección de las 
unidades a ser examinadas para un propósito no resulta, necesariamente, 
la mejor para otros. Como, en general, la selección debe hacerse una sola 
vez y en forma definitiva ese punto resulta de gran importancia cuando se 
selecciona el método a seguir. Me complace que la recomendación general 
para este tipo de propósito sea este muestreo aleatorio estratificado.” 


Más adelante, Neyman hizo un nuevo comentario sobre el problema 
del muestreo estratificado multiparamétrico. Durante sus disertaciones en 
Washington, D.C., se le preguntó qué hacer en el caso multiparamétrico, 
y contestó (Neyman, 1938, p. 98): 

“Celebro esta pregunta. Es cierto que prácticamente nunca planeamos 
una encuesta con el fin de estimar una sola media. Pero, en general, no 
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es difícil ver que una de ellas tiene más importancia que las otras. Si tal 
es el caso, entonces el número de muestreos debe ser establecido según el 
caso. Alternativamente, si hay varias características de igual importancia, 
podemos buscar aquella que puede ser llamada característica básica, y que 
tendría la propiedad de estar correlacionada con aquellas en las que esta- 
mos interesados. Esta correlación puede ser positiva o negativa, pero la 
correlación que resulta entre las correspondientes g, será siempre positiva. 
Por eso, un ajustamiento de acuerdo a la característica básica, siempre ten- 
derá a mejorar la exactitud.” 

Peters et al. (sin fecha) trataron de hallar una afijación intermedia 
para las encuestas que involucraran valores de dos o más variables. Ellos 
encaraban una afijación n, que maximizase la suma de las cantidades de 
la información relativa a varias variables, “la eficiencia relativa” de la 
afijación realmente utilizada. “La eficiencia relativa” para una cierta va- 
riable X se define como 


o 


1/0? (2) _ Caja E 
lin (2 a. (x') 


donde 0%, (e ) es la varianza cuando se usa la afijación de la varianza 


(4) 


mínima, y o. (2') es la varianza cuando se usa la afijación intermedia. 
Ellos trataron luego de maximizar 


Y Ex = Ex + ... +Ez (5) 


De acuerdo a Snedecor et al. (1942, p. 99), el valor real de esta apro- 


ximación consiste: “ en el aislamiento de aquellas características que 
no pueden ser estimadas muy bien junto con la mayoría. La segregación 
de estas características da al muestrista la alternativa de omitirlas en el 
diseño, o procediendo con el pleno conocimiento de la poca cantidad de 
información disponible, o de establecer muestreos separados diseñados para 
que contribuyan a la información que les es requerida. 

Una presentación interesante de una aproximación práctica se halla 
en Hansen et al. (1953). Los autores examinan una encuesta donde es 
importante obtener “buenas” estimaciones de ciertas características agrega- 
tivas (tales como inventarios totales), también como de ciertas caracterís- 
ticas distintivas (tales como porcentaje de almacenes con características 
específicas) para una población de almacenes. Los autores proponen un 
procedimiento de tipo sucesional: primero la afijación óptima es deter- 
minada con el propósito de estimar las características agregativas; posterior- 
mente se agregan observaciones adicionales a aquellos estratos de los cuales 
se espera que hagan la contribución principal a la varianza de las caracte- 
rísticas distintivas. 

Además, el problema presente ha sido considerado por Mabhalanobis 
(1944), Geary (1949), y otros; sin embargo, estos autores se han confor- 
mado con escribir ideas totalmente generales. 

En los siguientes párrafos, presentaremos algunas ideas que pueden 
resultar aplicables 
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USANDO FUNCIONES SIMPLES DE LAS VARIANZAS UNIPARAMÉTRICAS 


El uso de alguna afijación intermedia en vez de una afijación de la 
varianza mínima, resulta en una varianza 


a (2') > 0min (7) (6) 


Una medida razonable de la “pérdida de información” relativa, causada 
por el uso de la afijación intermedia, es 
o a Ay o PP. 
A 0. (2') — Omin (2) 
E 2 oy 
Can NA ) 
L;z etc. pueden ser definidas en forma similar. 
Una medida de la pérdida relativa total de la información puede 
definirse por 


Lix +. > Lx + + Lz = 2 Lx (8) 


5 E objetar esta medida sobre la base de que a cada una de 
las E « «+. Ly se ha dado el mismo peso. Así alguna función de ponderación 


Lxa+..+2=XóxLz (9) 


puede ser utilizada en vez de Líx4  +zy Aquí gy es alguna medida de 
importancia. Puede ser la que fue considerada por Geary (1949, p. 5): 

“Sería muy sencillo encontrar el modelo de muestreo que asegurase 
que la razón, para el promedio ponderado de las principales estadísticas 
agropecuarias, tenga una varianza mínima, estando las ponderaciones pre- 
determinadas relacionadas tal vez con la contribución de cada estadística 
al ingreso agropecuario.” 

O 4, puede ser determinado como lo propone Mahalanobis (1944, 
p. 367): “Ponderaciones determinadas digamos, por el valor monetario de 
las diferentes variables.” 

O b. --- $. puede ser un conjunto de ponderaciones que tenga alguna 
otra propiedad deseable. 


Ahora, al resolver por mínimos 


L 
F =  óx Lx+A En—n) (10) 
h 


la afijación correspondiente a la pérdida mínima de información ponde- 
rada para un tamaño fijo de la muestra está dado por 


yz o: E rr? 


Tin (x ”) 


Ey io a EX) 


O» L 


min 
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Para $, =1, p,¿ etc. = 0, esta expresión para n, simplifica a la fórmula 
previamente dada para la afijación de la varianza mínima. 

La medida Lixw+ .+2z) aquí utilizada es aquella que resulta natural 
para el caso en que n esté previamente fijada. Sin embargo, es de alcance 
limitado ,en el caso en que n no ha sido fijada con anterioridad. 


L 
Si el tamaño de la muestra n = Y n, o más generalmente el costo 
h 


L 
C (2) = E C,n, no está previamente fijado, un criterio natural es el de 
h 


minimizar (' (2') sujeto a la condición que 


(12) 


como lo propuse en 1949. Siempre hay un conjunto n, que satisface esta 
condición. En la siguiente sección se aplicará una técnica similar a la de 
la programación lineal al problema de hallar este conjunto; la técnica 
será denominada aquí como una técnica de programación.* La presenta- 
ción sigue a Dalenius (1952). 


5. UTILIZANDO UNA TÉCNICA DE PROGRAMACIÓN 
La programación lineal ha sido utilizada extensamente durante la 


última década para tratar con problemas de afijación de recursos. Es 
natural aplicar una técnica similar al problema presente. 


El caso uniparamétrico 


4 L 
Estimamos X por el estimador lineal 7' = Y W,7;,. Suponemos que 
h 


para todo h la fracción de muestreo n,/N, es lo suficientemente pequeña 
como para justificar 


L qee 
Dye ,2 Y 
(1) = E W; 2 (14) 
h UN 
Por simplicidad, la discusión se limita al caso L = 2; la generalización 
para L > 2 es directa. 


3 Yates (1953) ha propuesto la siguiente aproximación. A la función 


F=Y Can +Mlet( —0t(2) +... + Ax[0?t(7') — 04”) (13) 
h 


se le calcula la derivada para cada h a la vez. Al resolver las ecuaciones resultantes O F/dn4 = 0, 


se determina la afijación de m,. Sin embargo, esta aproximación presume que la cantidad de 
estratos es mayor que la cantidad de condiciones a cumplir, K en la fórmula antes citada. 





EL MUESTREO ESTRATIFICADO MULTIPARAMÉTRICO 


Ahora para 
(1) la afijación proporcional 


UN W, 


No W, 


(2) la afijación de la varianza mínima 


N> W,o(X,;) 


m  W.e(X,) 


(3) la afijación Óptima 


n; WAX) VO, 


— == —_——— (17) 


No Wao(Xo) VW Co 


En un sistema de coordenadas cartesianas con ejes n, y na, estas rela- 
ciones son líneas rectas que pasan por el origen. En el mismo sistema, 
n=n, + y C(2) = C, n, + Can, son líneas rectas que cortan los ejes. 
Finalmente, la imagen geométrica de 


(18) 


es una familia de hipérbolas. Ahora resulta fácil interpretar geométrica- 
mente las diferentes formas de las afijaciones. 
(1) Afijación proporcional 
Para una varianza fijada 0, (2'),1n, y n2 están determinados por la 
intersección de 
, , 2 > 
2) : ¡a € (X,;) 


oz A EA (19) 
Na 


(20) 


Para un tamaño total fijo de la muestra, n, y na están determinados 
por las coordenadas n”, y n's donde 


N; =N —M, (21) 


W, (29) 


se cortan. 
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(2) Afijación de la varianza mínima 


Para una varianza fijada o, (2'), n, y na están dadas por la inter- 
sección de 


2 (y 2 (y 
dE - 1 == Xy y E (X2) 


ny Na 


- 


(23) 


W, C (X, j) 


E a le 
Ws g (Xas) y 


n 
FIGURA 1. REPRESENTACIÓN GEOMÉTRICA DE LA AFIJACIÓN 
DE LA VARIANZA MÍNIMA 


(Los números entre paréntesis se refieren a los de las fórmulas correspondientes.) 


Es posible probar que n, —29 — M2 €s una tangente a la hipérbola 


o, (2') en el punto de intersección. Desde la expresión de dí (2) 


dan A Wio (X,) (25) 
d n> nn Wida (X1;) 


De n,=n—NM> 


o (26) 
d na 
y entonces 
W, o(X;;) 


Y SA 
W20(X25) 


que prueba el enunciado. La Figura 1 ilustra la situación. 
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Para un n determinado, la afijación de la varianza mínima está dada 
por la intersección de 


N; =N —M> (28) 


W,o(X.) 
Wa o (Xo;) 


(29) 


(3) Afijación óptima 


Resultados análogos son derivados fácilmente para este tipo de 
afijación . 


El caso multiparamétrico 


Para simplificar, la discusión se relacionará con Ja afijación de la 
varianza mínima. Además, y también para simplificar, únicamente se dis- 
cutirá el caso que involucra sólo L —= 2 estratos y 2 parámetros, X y Z. 
Estos parámetros serán estimados por los estimadores lineales usuales. 

El primer problema a discutir es el de hallar el tamaño más pequeño 
para la muestra n= 1, + ny que satisfaga las condiciones 


< 00 (21) 

; (30) 
< 0) (2) 

Ahora, la hipérbola a? (2) = 0, (5”) divide al cuadrante (n,; n>) en 
dos áreas. En el área a la derecha y por encima de 0,(2'), n1; na corres- 
ponden a las varianzas o? (2”) que son más pequeñas que d,(2'); de modo 
que este área es “admisible” como lo es, además, el borde del área. Se 


logra un resultado análogo para 0 (2/). 


En general, las dos hipérbolas se cortan, como lo ilustra la Figura 2 


Sobre el borde y dentro del área “sombreada” de la Figura 2, se 
cumplen las condiciones 


< a (1) 


00 (2) 


(31) 


La solución está dada por aquel punto para el cual n, —=n — nm, es una 
tangente al área sombreada. 


Si las dos hipérbolas no se cortan, entonces 


W; o(X;;) W, o(Z;;) 
as y TE aa 
Woo (Xo,) > Wo (Zo;) ó 


n; = 
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La solución está dada por aquel punto para el cual n, = n — Ny es una 
tangente a la hipérbola a la mayor distancia del origen. 


n, 


FIGURA 2. REPRESENTACIÓN GEOMÉTRICA DEL CASO MULTIPARAMÉTRICO 


A continuación se considera el caso en que n =m1,-+ n, está fijado. 
En general el punto Py correspondiente a o, 


min 


(27) es diferente del punto P, 


correspondiente a 0m;n (2). 

A fin de determinar una mejor combinación única de nm, y na debe 
introducirse alguna condición extra; la solución dependerá, obviamente, 
de la elección de esta condición. Esto puede involucrar alguna clase de 
compensación de pérdidas de información causadas por las desviaciones 


de 0min (2') y 0min(2? respectivamente. De este modo, puede ser posible la 
utilización de algunas de las ideas desarrolladas anteriormente en este 
capítulo. 


La aproximación geométrica aplicada aquí al problema del muestreo 
estratificado multiparamétrico puede, alternativamente, basarse en un 
sistema de coordenadas utilizando 1/n, y 1/n2 como ejes. En este sistema, 
o” (2) y a? (2) son líneas rectas; n — Ny + N2 es una hipérbola, etc. 


Así, el caso en que la condición a cumplirse esté dada por 


o (7) < 17) 


(33) 


, 


“(D)<da 


para la muestra más pequeña posible n está ilustrada en la Figura 3. 
Aquí la discusión se ha limitado al caso L= 2 y dos variables. Sin 
embargo, es obvio que la técnica es aplicable a cualquier L y a cualquier 


cantidad de variables. Para los problemas de cálculo que se presenten, 
la técnica desarrollada para la programación lineal resultará provechosa. 





EL MUESTREO ESTRATIFICADO MULTIPARAMÉTRICO 


Un, 


FIGURA 3. REPRESENTACIÓN GEOMÉTRICA ALTERNATIVA DEL CASO 
MULTIPARAMÉTRICO 


6. UTILIZANDO COMO APROXIMACIÓN UNA CURVA DE INDIFERENCIA 


La teoría moderna de los índices se basa en el concepto de indiferen- 
cia. Aquí, esta teoría, tal como la presentó Malmquist (1953), será aplicada 
al problema presente del diseño de muestras. 

Con el propósito de simplificar, se discutirá el siguiente caso sencillo. 
Los parámetros que deben estimarse son X y Z. Los estimadores son 
P > e e, á > E ME á hada” ÉS ; 
7 =-=W,x; + W.1) y 27 = W, 2, + W,z2, respectivamente. La función de 
costo es € (17) = C; ny; ES C) No. 

La aplicación postula la existencia de una función de “indiferencia,” 
a saber: 


U=U[0 (7 ;n,;n); 0 (2 ;n,;n))] (34) 


Resolviendo U = U, con respecto a nm, y na obtenemos la curva de 
“indiferencia” 


I =1I(n,;n,| Up) (35) 


Esta función es el locus de todos los puntos n,, na que resultan en esti- 
maciones z' y 2' con el nivel especificado U,. Si 1 es convexo y cumple 
ciertas condiciones, en cuanto a la diferenciabilidad, la afijación óptima 
está determinada por el punto en que ('(7”) es tangente a la curva 7. 

Claramente, 7 corresponde a una curva de “indiferencia.” Como ejem- 
plo, U puede estar dado por 


1 


NET] 7 
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Es evidente que la aproximación utilizada aqui puede ser generalizada 
para incluir L estratos y cualquier número de variables. 


Dos APROXIMACIONES GENERALES 


Lo característico de las discusiones en las secciones 4 — 6 fue el uso 
de los conceptos uniparamétricos, tales como g*(2') etc. En este párrafo, 
se considerarán otras dos aproximaciones generales. 

En [Dalenius] (1949) traté ligeramente la posibilidad de la utilización 
de una varianza generalizada. Designemos por 


a (5)...o(2,7) | 


DUZ...7) = (37) 


- - » - 
el, 7)... (7) 
la matriz de dispersión de las varianzas y covarianzas. Es posible volver 
a escribir la matriz en la siguiente forma 


(Xp)... (Xp Za) 
Dz... E (38) 
(Za Xp)... 0 (Za) 


El determinante |DY(2*...2)| =A(%'...2)es la varianza generalizada. 
Puede parecer natural hacer uso de A(z'...2') en forma análoga a la forma 
en que se utiliza a g*(7') en la teoría de una variable, por ejemplo, mi- 
nimizar A(Z'...2') sujeto a alguna condición de costo. 

En general, esta aproximación resultará engorrosa si la cantidad de 
estratos y/o de variables es grande. Sin embargo, una restricción más seria 
para esta aproximación es la que se trata a continuación. 

Consideremos el caso con sólo dos variables cuyas medias son X y Y 
respectivamente, y dos afijaciones diferentes, con los estimadores 7”, y! y z” 
e y” respectivamente. El hecho de que A(2”, y') = A(2”, y”) no significa, 
necesariamente, que las dos afijaciones sean igualmente buenas, desde un 
punto de vista práctico. 

La siguiente aproximación, basada en una combinación de las funcio- 
nes de costo y de pérdida, tal como fue desarrollada originariamente para 
el caso uniparamétrico por Blythe (1945), elude la dificultad que acaba- 
mos de mencionar. 

Cuando se utilizan las estimaciones 7... z de los parámetros is 
se incurre en una pérdida (en ciertos tipos de encuestas) que depende de 
las desviaciones Az = 35 : AZ. Esta pérdida se representará aquí 
por L(Az ... Az). Al planear una encuesta, el tamaño real de esta pérdida 
no puede ser determinada. Sin embargo, por conocimiento de la función 
de frecuencias de las desviaciones f(AZ ... A2; m; n,) que depende tanto 
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de n como de la afijación n, del tamaño total de la muestra, la pérdida 
esperada para un 2 dado y una afijación dada es 


L(n;n,) -)/ .J Lar. sosa AZ;n;n,) dAx...dAz (39) 


El costo para llevar a cabo una encuesta está dado por C(n;n;). 
Entonces, es razonable determinar n y la afijación n, de modo tal que 
minimice 


F Cln;n,)+L(n; n) (40) 


lo que es equivalente a minimizar el gasto total esperado 


Intuitivamente, la afijación más interesante sería usar la teoría de la 
función de decisión. Sin embargo, esta teoría no ha sido desarrollada aún 
para adecuarla a las aplicaciones prácticas 


APÉNDICI 


Uso DE LA TÉCNICA DE LA PROGRAMACIÓN EN LA TEORÍA 
DEL MUESTREO EN DOS ETAPAS 


La técnica de la programación usada en la sección 5, tiene un amplio 
campo de aplicabilidad en las teorías de encuestas por muestreo. Un ejem- 
plo lo doy en el capítulo 10 de mi libro.* Aquí la técnica será aplicada 
a la teoría del muestreo en dos etapas. 

Una población está formada por M unidades primarias de muestreo: 
cada una de tales unidades contiene y unidades secundarias de 


muestreo 
El parámetro que debe ser estimado en la media por unidad secundaria. 


M 
E os 41 
E * <= Ye «e 4 ) 
Ñ MN 


Por medio de un muestreo aleatorio simple se seleccionan m unidades 


primarias de muestreo. De cada una de estas m unidades se seleccionan 


n unidades secundarias de muestreo. Ahora, X es estimado por 


=) 
E 


Si las fracciones de muestreo en ambas etapas son pequeñas, la varianza 
está dada por 


Dalenius, op.cit 
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donde g, es la varianza entre las unidades primarias de muestreo pol 


unidad secundaria de muestreo, y 0, es el promedio de la varianza dentro 


de las unidades primarias de muestreo. Si la función de costo es 
C(=')=C,m+ Comi (44) 
se puede comprobar fácilmente que (suponiendo N 0; — > 0) 


Pr 
A E ¿ 
optn = — — (45) 

di Ca 
Utilizando la técnica de la programación, el análisis funciona como 

sigue. Primero, es conveniente hacer m n p. Entonces 

2 (=p 01 2 : 
o (2) = (46) 


m 


C (2) = C,m+C),p (47) 


Además, la solución del problema para determinar m y p en forma 
óptima, supeditado a un costo fijo C,, se halla como sigue 


, , 


F — ds + es + MC; m + Cp E Co) 
m Pp 


gr 


o; : 
y == —= PAC; 
om m* 


E o 

0D Ñ 

US ¡| Co e 

Mia ln (50) 
02 C1 

En un sistema de coordenadas cartesianas, las ecuaciones (46), (47) y 
(50) pueden estar representadas en forma análoga a las que se han dado 
en la sección 5. 

Un análisis del caso revelará resultados similares a aquellos que fueron 
presentados en la sección 5. De este modo, (47) es una tangente a (46) 
en la intersección de (46) y (50). Esta intersección corresponde a la solu 
ción óptima (Mp; Popt)- 

Por métodos análogos a aquellos tratados en la sección 5, el caso mul 
tiparamétrico puede analizarse por medio de la técnica de la progra 
mación. 

Es fácil ver como la técnica de la programación puede ser utilizada 
en conexión con otros tipos de diseño, por ejemplo, muestreos en dos etapas. 
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RECENT ADVANCES IN SAMPLING TECHNIQUES 


Angeles, 


obtenida 


articulo 
podría 


ss 


Reliability 
California 


Nota 


de 
puc 
1 


expertos 


edil 


Directo1 


en € 


de permanecer 


“vida 


HarrY G. RomMiG, U.S.A 


Este trabajo comprende una serie de planes de muestreo 
aplicables a la vez a datos sobre atributos y vatiabies, que han 
sido desarrollados durante los recientes años pasados para su 
aplicación directa a la imaustria tn éí se delinea la tendencia 
corriente para determinar no sólo si los productos deben sel 
aceptados, si el criterio o los criterios para el muestreo de ensayo 
han sido llenados, sino también si tales productos satisfacen 
los requisitos de seguridad con tos límites de confianza estipulados 
en los contratos o establecidos por razones comerciales o mili 
tares. Con la inclusión en equipos complejos, tales como cohetes 
al espacio, proyectiles y parecidos suministros—de gran cantidad 
de componentes electrónicos provisión de fuerza motriz y m« 
canismos complicados se requieren cuidadosas evaluaciones esta 
dísticas de los resultados por muestreo que cubren sus caracte 
rísticas esperadas de funcionamiento, de vida, y de vida válida. ** 
Estas son descriptas de modo que es posible proporcionar técnicas 
de muestreo más eficientes para las partes las componentes, el 
conjunto de piezas, los subsistemas y sistemos a fin de reducir 
los errores a un minimo. Se proveen relaciones matemáticas para 
hacer estas evaluaciones en forma que sean fácilmente aplicadas 
Se presentan planes de muestreo simple, doble, múltiple, sucesivo 
y continuo. Se relacionan criterios en función de los defectos 
los defectivos, los promedios admisibles, los valores máximos 
para las medias y amplitudes de las muestras, los promedios + 
las desviaciones estándares, aplicando resultados de muestreos 
por bloques o promedios moviles, amputudes y desviaciones 
estándares o varianzas. Se explica la garantía cn función del 
riesgo del productor,” “riesgos del consumidor niveles acep 
tables de calidad,” “niveles de calidad promedio de salida 
limites y límites de confianza Se discuten promedios de 
tratamiento, tasas de fallas y medios para obtener controles del 
proceso. Este trabajo suplementa el clásico trabajo del Profesor 
Neyman: “Sobre los Dos Aspectos Diferentes del Método Repre 
sentativo: El Método de Muestreo Estratificado y el Método de 
Selección Dirigida.'”” En él se trata del empleo de la distribución 
trinomial donde el muestreo aleatorio estratificado se utiliza 
para reducir la inspección de los costos y los errores. Esta nueva 
aproximación emplea datos del pasado y registros para ayuda 
a que el método de muestreo, proporcione la información máxima 
al costo mínimo en los campos del control de la calidad y la 
seguridad 


Hofíman Laboratories Division, Hoffman Electronics Corporation, Los 
article was prepared in December 1959 


La traducción del término “shelf life,” de acuerdo a la información 
ste campo, significa la duración, en meses o años, durante el cual un 
en existencia sin deterioro en su capacidad de acción Literalmente 
enamiento.” 


118 





RECENT ADVANCE IN SAMPLING "TECHNIQUES 


NATURE OF SAMPLING PLANS 
Purpose 


Data are accumulated for many purposes. When experiments are being 
made, certain characteristics are selected to evaluate their values and 
contributions. Experiments have been conducted and measurements have 
been taken to determine the velocity of light, the charge of an electron 
and other physical values. Such fundamental constants require both 
accurate and precise evaluations and are additions to the general fund 
of human knowledee. Many tests and measurements must be made to 
provide these results. The values obtained depend entirely on the sampling 
results and it is hoped that the values obtained are truly representative 
of the exact values or at least the expected values. One purpose is to 
obtain the best possible estimate of these physical constants 


Another purpose is comparison by a common system of evaluation 
wo or more methods are being compared. Critical measurements are 
made to determine which method is most effective. Population data arc 
obtained to determine increases or decreases in the number of people in 
various areas or cities. Growth patterns are determined, health results are 
tabulated. Generally it is too costly to obtain 100%, coverage of the factors 
being evaluated, hence 100%, inspection and evaluation are replaced by 
sampling, wherein only a portion of the population under discussion 01 
“the universe of discourse” is taken to represent the whole. It is necessary 
to secure samples that best represent the parent population. Professor 
Neyman's classical paper, “On the “Two Different Aspects of the Represen 
tative Method: The Method of Stratified Sampling and the Method of 
Purposive Selection” covers the theory of the representative method and 
the contributions of Professor A.L. Bowlev to the practical applications 
of the representative method. Many others have worked in this field since 
this paper appeared in 1934. It is the purpose of this paper to cover 
recent sampling methods and techniques that are related to a wide variety 
of activities. Random sampling, representative sampling, stratified sampling, 
purposive sampling and weighted sampling will be discussed. There will 
arise some cases where only one unit is available. Sometimes repeat 
measurements may be taken if the test is non-destructive. For destructive 
tests, as few units as possible are tested to evaluate the characteristics 
If only one unit is available a destructive test is not feasible. A correlated 
non-destructive test must be made that is closely correlated to the cor- 
responding non-destructive test. Since only one unit is available, the 
variation between units cannot be obtained except by analogy with some 
selected somewhat similar test for which data are available. The purpose 
of these tests on one or more units is to compare one method with another, 
one product with another product, obtain correlation between destructive 
and non-destructive tests, where possible 


Another purpose of sampling is to make critical experiments. “Thus 
designs of experiments for particular types of problems must be made that 
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provide maximum results at minimum costs. Many recent books have 
been written in this field. The statistician in this field must also be an 
expert in liaison work with scientists, research workers and experimental 
engineers. Some knowledge of value engineering, product engineering, 
human factors and production is also required. Selection of samples that 
provide representative and unbiased results is a science in this area. 

Samples are used to determine acceptance and rejection of submitted 
products. What size samples shall be used? How shall such samples be 
selected? What criteria shall be used to make a decision? These are factors 
that must be considered to cover this sampling purpose 


Samples are selected from a production line for the purpose ol 
maintaining production controls at desired levels of quality. How shall 
such samples be selected? Is it possible for the operators.to measure their 
own work and render unbiased judgmenis concerning its quality and 
adherence to specifications? Generally periodic random samples are selected 
and measured. These provide sufficient data to maintain controls for the 
more important characteristics. 


Samples are used for reliability, environmental and operating tests 
Some are used for “austere flight” programs and others for final flight 
checkouts. Others must meet the packaging and shipping requirements 
while others must satisfy system requirements. Results must be such that 


malfunctions, if anv, can be readilv identified and corrected, where 
possible. 


With so many purposes for taking samples it is necessary to restrict 
this paper to one or at most two areas. Sampling plans for attributes and 
variables inspections and tests are described. Also sampling for reliabilit 
evaluations is presented. “The theories behind these plans will be given. 
Establishing economic standard quality levels and selecting the most 
economical plans for such levels is an area that is not covered adequately 
in texts or papers. Utilizing basic data to divide manufactured products 
submitted for acceptance into three categories: Satisfactory, questionable, 
and unsatisfactory and also accepted products into three groups: Reliable, 
questionable, and unreliable is used as a basis for developing the trinomial 


distribution for applications to acceptance sampling and  reliability 
evaluations. 


Concepts 


Sampling inspection for acceptance-rejection purposes is established 
to provide protection to both the producer and the consumer. The earlier 
plans were based on the consumer protection concept. There were two 
kinds of probabilities associated with products submitted for acceptance. 


1 he probability that the product submitted is satisfactory, P,. 
o 


2. The probability that such satisfactory product will be accepted, P,. 


The total probability related to the operation is the product of these two 
probabilities, i.e. P = P,P,. Generally P, is not considered. For such 
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products the basis for acceptance or rejection may be in terms of attributes 
or variables. The most common sampling plans are based on the method 
of attributes where units are classed as conforming or nonconforming to 
engineering requirements. Units have a two-fold classification whereas in 
the method of variables they have a multi-fold classification based on 
measured values or values read from meters or inspection apparatus 01 
equipment. 

First consider attributes inspection. A nonconforming unit may be 
considered a defect or a defective. Any failure to meet an engineering 
requirement for a single characteristic is termed a defect. Any unit having 
one or more defects is considered a defective. Inspection plans may appls 
to a single characteristic or to groups of characteristics or to every character 
istic that may be stipulated for a single class of product. Criteria for 
acceptance or rejection will be based on the number of defects or defectives, 
d, observed in a sample of n units, where n = the sample size. Let e be 
the acceptance number or maximum allowable mumber of defects or 
defectives allowed in a sample of size n in Single Sampling, where only 
one sample is used to render a decision whether to accept or reject a lot 
of size N. The consumer's risk then is 


n —m 


] m ( Ñ 
, M ¿¡M 

Po=— Y ( a (1) 
C. m=0 


n 


where C? is the combination of N units taken n at a time as is evaluated 
by the relation 


OA = —_—_—_—. S 
(N —n)! n! 

with N! EA N, termcd N factorial. M p,A number ol 
defectives in a lot of N units where fp, per cent or fraction defective 
(Hereinafter only a single defect will be considered rather than detectives 
his makes it easier to discuss variables inspection .) 


If p is the fraction defective for the particular characteristic for the 
entire universe U, consisting of all units of the same kind made in the 
past and to be made in the future, then there exists some value M, for lots 
all of size N that is not considered too large for classing the lot as a 
satisfactory lot. The distribution ol M values will be in accordance with 
the binomial distribution and will be represented where q | p, by the 
relation 


a+rn?= 4 +NQ 


where 
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and M = 0,1,2.....,N, with 


¡N N=M_M 
Pnx,y = C2M4 p 


For M,, then 
P, = Ci, 4 


The term M has been used in two senses as a particular value M 
and as a general term in the distribution of M values. 
Possibly for the most general case 


M sM 
m ( m 


P. = 


Mia sriMs ” 
73 m ( m (1) 
( m 


n 


The above relations have been given in considerable detail to 
emphasize the fact that when a single lot is under consideration, the 
probability of acceptance, P,, or the probability of rejection, P,, may bi 
evaluated readily. The term p, is termed the tolerance traction defective, 
hence this concept is termed the lot tolerance-consumer's risk point of view. 
If the producer's risk is considered, its probability is based on a series of 


lots rather than one. Its probability of acceptance is obtained from the 
binomial 


m ( 

e m nm _m - 

P. = E Cm 1 Pp (4) 
m=U 


It is often obtained from the Poisson exponential, used as a good ap 


proximation to the binomial when fp is less than or equal to 0.10. For 
this approximation 


pn / m 


(pn) 


Pp E 
m, n, pn 
m! 


PP (pn)” 


(9) 
: : 


m! 
These three relations, (1) the hypergeometric, (2) the positive binomial, 
and (3) the Poisson exponential define the probabilities used in the 
method of attributes. The negative binomial is used in some statistical 
work but is practically never used in acceptance—rejection sampling. 


Summarizing the concepts that apply to both attributes and variables 
sampling will provide the basis for evaluating these plans in more detail 
later. The types of Inspection are: 


Single sampling—one sample only, » 
Double sampling—two samples, », and n 
Multiple sampling—three or more samples, actually more than one sample 
Ma. Ny ny; for k samples 
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Sequential sampling—a series of samples usually taken one at a time but 
may be taken in groups, thus reducing to multiple sampling. 

Continuous sampling—for constant production with no basic lots, successiv 
samples are taken from a continous flow of product and varving amounts 
are accepted based on sampling results. 


Protection is afforded by four different concepts. “These are: 


I. Lot tolerance—consumer's risk Pr Po). 
tl Process average—producer's risk 
IM. Average outgoing quality limit 1OOL) 


IV. Acceptable quality level. (AQL) 


Sometimes combinations of these are used but generally one of these is 
selected as the basis for choosing a plan of inspection. When a plan is 
selected it may often be evaluated in terms of the other concepts 


For reliability evaluations data from any sample or set of samples 
may often be used to obtain a measure of reliability. In reliabilitv studies 
some data have indicated early initial failures, then a constant failure rate, 
followed by a wearout period. Wearout occurs from the time the product 
is first used but the time at which wearout occurs rapidly is considered as 
the beginning of the wearout cycle. With a constant failure rate the 
Poisson exponential is used as a means of obtaining a measure of reliability. 
The reciprocal of the failure rate is used to determine the mean time 
between failures (MTBF). Some tests are made to complete failure to 
determine the mean time to failure (MTTEF) or some like to use mean 
time before failure (MTBF). These are average values. The failure rate 
is given as X%, /1000 hours or as bits, failures /100,000,000 hours o1 
failures X10$ hours. Others prefer to use minimum number of hours prior 
to failure. Much work needs to be done in this area to obtain better 
reliability measures. 

In realiability confidence levels are often used. What is the proba 
bility that such a realiability value is valid? Degree of belief P, is also used 
to express such confidence levels or limits. There is a desire to have a 
confidence of 99.99% that the reliability is 99.99%,. These values may 
also be expressed as decimal values less than 1, i.e. 0.9999. Practically 
confidence levels of 0.80, 0.90, 0.95 and 0.99 are often used. The amount 
of data required to obtain reliability values with probability values equal 
to 0.99 or better is so large that the cost of obtaining valid data for such 
values is often prohibitive so that approximations are used to obtain 
numerical values that meet contract requirements. Thus desired reliability 
values are olten never obtained. Both attributes and variables data mar 
be used for these evaluations 


Criteria 


he criteria used for attributes inspections are generally expressed as 
number of defects, number of defectives, number nonconforming, and the 
like. For weighted defects with demerits, assigned criteria may be in terms 
of demerits or demerits per unit values 
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For variables inspections and tests the criteria may be in terms of 
allowable averages, maximum values for ranges, standard deviations, mean 
deviations and variances. Many combinations of these may be used. Some 
plans use variables criteria for first samples and attributes criteria for 
second or total samples. 

For reliability evaluations MTBF values may be established as final 
criteria together with a confidence level. For complex equipments 50 hours 
might be established as a minimum value for MTBF for a single product 
or for the entire system. 

Whatever criteria are established for use, they should be established 
prior to the tests. Changing the inspection and reliability evaluation rules 
destroys the usefulness of the data and makes it impossible to make valid 
predictions. 


Selection of Samples 


In most sampling plans it is assumed that samples will be seiected 
at random. Each unit should have an equal chance of being selected 
In other cases representative samples may be chosen. If units of a given 
product are produced by 5 different machines working two shifts and a 
lot consists of the production of both shifts during a day and a sample 
of n —= 80 units is being selected, it may be desirable to take 8 units from 
the product made by each machine during each shift, i.e. 8x5x2 = 80 
units. The 8 units from one machine might be selected at random during 
the period of operation of the day shift, and likewise another 8 units from 
the night shift. However it may be desired to take 1 unit each hour during 
an 8 hour shift. Eventually the single unit selected in any one hour should 
probably be taken at random. However the selection might always be 
made on the hour or half-hour so that no random samples are taken at any 
stage of sampling. 

If there is a special purpose for taking certain measurements 01 
making some special tests then purpostve sampling might be used. For 
example, a group of diodes may be exposed to light and samples are 
selected only from these diodes. Others have been on the shelf for a yea1 


so that a special sample is selected only from this small group. For special 
studies, samples are selected to provide a sequence of data necessary to 
check certain assumptions. Such samples are continuously being taken in 
research programs 


For process controls and for reliability testing sampling schedules are 
established that provide the basic data that are required. Generally for 
acceptance-rejection inspections and tests, random sampling is used. The 
purpose of taking data should be established. A sampling plan should 
be selected that best achieves this purpose. The manner of selection is 
chosen that best fulfils the requirements and needs of the program. 
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Ill. ACCEPTANCE-REJECTION SAMPLING 
Attributes Inspections and Tests 


In acceptance-rejection inspections and tests there are many types of 
plans. As previously noted, those used most frequently are: (1) Single 
sampling, (2) double sampling, (3) multiple sampling, (4) sequential 
sampling, and (5) continuous sampling. Plans established for any of 
these types will provide the desired protection features desired within the 
limitations of attributes inspection where defects or defectives occur as 
integral values. Fractional defects cannot be used, having no meaning. 
Units must be inspected generally, not half units, but it is possible to 
have complex units and inspect or test only a fractional part of the 
components on such a unit. For example if 10 resistances are on a module, 
a 40%, sample would require only 4 of these in the sample 


he criterion or criteria will be acceptance mumbers, c for single 
sampling, c, and c, for double sampling where c, applies to the n, + n, 
units in the two samples combined, etc. In one multiple sampling system 
the number of defects observed im samples for acceptance must be ont 
less than the mumber of samples. Many standard sampling tables have 
been made and are in use. Operating characteristics (OC) curves have 
been made after an enormous amount of computations and give probability 


of acceptance values for incoming quality p. “These curves make it possible 
to compare plans readily and select the plan that satisfies the needs of 
any project. 


5.1 Icceptable Quality Level (AQL). Where sampling plans ar 
based on the AQL concept, there is associated with each such plan a 
probability of acceptance value, P, that has some definite value such 
as 0.90, 0.95, 0.99, and 0.999. The tables given in MIL-STD-I05A [2 
for single sampling, double sampling and sequential sampling are supposed 
to be based on a P, value of 0.95. However, due to discreteness and some 
arbitrary choices made in setting up these tables, the P, values for the 
AQL values covered in these MIL-STD-105A tables vary from about 0.88 
to 0.999, with the majority approximately equal to 0.95. The sequential 
plans are block truncated plans where a final decision must be rendered 
after five to ten samples of equal size have been inspected. These plans 
are stipulated in many contracts particularly government contracts 


he producer and the procurement agencies like these plans since 
they usually result in more than 90%, acceptance of product at thx 
stipulated AQL values. However, many of these plans also will accept 
very unsatisfactory product as much as 50% of the time. This occurs when 
samples are small. “The first AQL tables gave AOQL. values also. “The 
AQL values listed were in steps such as 0,25%, 0.409%,, 0.65%, and 1.0% 
The AOQL values were approximately one step larger than the AQL 
values, 1.€. for AQL values of 0.65%, the AOQL values are approximatel, 
1.09 lhe meaning ol AOQL is given in the subsequent paragraphs 
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0) 


3.2 Average Outgomg Quality Limt (AOQL). This concept has 
met with considerable favor since it provides overall protection for a series 
of lots rather than for single lots. Its potential protection is provided by 
having the balance of the units in a rejected lot inspected 100%, thus 
supposedly eliminating all noncontorming units and, if possible, replacing 
them with conforming units. Where Pp, is the average outgomg quality 
and p is the average incoming quality with no inspection Pp, Y... TE 
however, some average amount of inspection / is performed then 


(10) 


where all defects or detectives, d, tound are replaced. 1 not replaced, 
equation (10) becomes 


MM" (10) 


Po obtain a maximum value for the p,, diflerentiate (10) with respect 
to P where / is also a function of p. “This gives as the AOQL values P,, 


] a » dl 
2: TE E (11) 


dp N N dp 
Determining fp, from this equation, then 


N-—1 
PL = Pm — == (12) 


where f, is the average amount of inspection per lot for average incoming 
quality p,. Values of 1 are determined from the following relations 


Single sampling. Sample size n, Acceptance number E. (ML) 
Lot size. 


I=n+(N — nmP. (13) 
where P Probability of rejection = P, . Hence 


T=n+(N -n (1 -—P,) =n+N-—-n-(N —9P, 


[=N-(N —mP, (14) 


If P,,, 1s the probability of observing zero (0) defects or defectives in a 
sample of size n: P;, , is the probability of observing one (1) defect or 
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defective in a sample of size n; and P,,, is the probability of observing / 
defects or detectives in a sample of size n, then 


E = $ 0 


and P,, can be determined from the hypergeometric relation, the positive 
binomial, the Poisson exponential, or any other applicable relation. The 
second two mentioned are usually used. The hypergeometric takes into 
account the size of the lot 


Double Sampling. First sample sizc 11, second sample size Mo; 
first acceptance numbe1 C¡, Maximum allowable number of defects in 
first sample, second acceptance number = c,, maximum number of defects 


in first and second samples combined; N Lot size 


[T=n¡+nP,¡+(N —n, —n,) P (16 


where 


4=C€ 


1 
P, =x ] coc po. Pon, 


Equation (16) may be rewritten as 


where 


+ Pr, n Po, Ny ( 19) 


y” 


Multiple Sampling, Sequential Sampling, Continuous Sampling. Th 
relations for / in double sampling are expanded to cover as many samples 
as may be taken. For triple sampling three samples are permitted with 
three correspondig acceptance numbers. If ten samples are taken then 
there shoula be ten acceptance numbers. Authors presenting such sam 
pling plans usually give some short-cut methods for evaluating probabilits 


of rejection and probability of acceptance values. The P, values are used 
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for drawing the OC. curve for each sampling plan. For example, for 5 
sample sizes with 5 acceptance numbers, / may be written as 


I=n,+n,P 4+934P9+n,4P3+n95P¿4+(N —n,—N29—N3—N4—N5) (1—P,) (20) 


5.3 Lot Tolerance—-Consumer's Risk (p,—P¿) or (py Po). As 
noted earlier individual lot protection is provided by using sampling plans 
based on the lot tolerance—consumer's risk concept. If a lot contains 
exactly M = fN defects or defectives the probability of accepting such 
a lot by plans under single sampling , double sampling, multiple sampling, 
sequential sampling and continuous sampling generally is computed by 
the hypergeometric relation, the exact equation derived for such evalua 
tions. However, in certain areas the Poisson exponential is used as a 
good approximation for determining these probabilities. Extreme care 
must be used in evaluating these probabilities. The consumer's risk P¿ is 
the probability of accepting a lot containing exactly M defects on the basis 
of the results of inspection. 


Single Sampling. Sample size n, acceptance number ce, lot size N, 
p, = Lot tolerance, M Number of defects or detectives in lot 


Pon LEON On 
n m=0 
Double Sampling Sample sizes, 11, Ny; acceptance numbers c, and Ca, 
where cz applies to results for both first and second samples, combined 
Account must be taken of the fact that when defects or defectives are lound, 
the total number of defects remaining in the remainder of the lot is reduced. 
he general form is first given and then a numerical example 


N — M a 1 'N — M M 
CA + ( ( 


> 5 L—b 4 o L 
R; m N UN C; 1 e, + la 


] 
L "IN — M M M +0, g¡M-c, 09 
Lt — Ch -— . “E ei ? (22) 


(CA 1 


-, 
1 


Numerical Example. N — 100: n, = 15, na 
py = 0.10 or 10%, M 10 :: Determine P, 


l 90 rr10 190 sr10 90 gr0 
Po e. + OU CO + 0307] + 
15 


90 ryl0 ] 
y100 Cy: 2 C3 ys5 
15 , 2 


(CEC + CRC + 0303) + 


2) 
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"SU 


5 0% Ci 


(0.180769 + 0.556790 + 0.291904) 0.129738 (0.078245 0,2 
EL 0.331950 + 0.03448/ (0.114470 0.312191) + 0.005690 (0.166502) 


0.829463 —--- 0.129738 (0.063768) -/- 0.034487 (0.426661) -- 0.000947 
0.829463 -.- 0.086116 4- 0.014714 0 .000947 — 0 


For this cas: COVCTrIina the consumer's risk with associated lot tolerance, 


O» 


the above example gives one point on the OC curve; 1.e., lor p 10 
P¿ = 0.9312, For exact computations, the above cquatión or its CONVErs 
in terms ol probabilits ol rejection or an equivalent equation based on 
combination theory must be used to provide the desired answers. Since ii 
takes so much time to compute these exact probability values, approximat 
equations using the Poisson exponential are generally used so that most 
OC curves that are published are only approximations. Also, in son 


cases, it is assumed that double sampling and sequential sampling curves 


( 


lor the same AQL values will be the same as lor single sampling. Checks 
that have been made indicate that there is considerable error in this 


assumption Where costs ol imspection are large and will be continued 


week alter wecx, it will be advantageous to compute the exact values and 


even modily the plan to provide the desired protection 


Since in research and development components used are not bemo 


il 6l 


continuously supplied, it is necessary to have the parts in the model 
reproduction prototype mect the. enginecring requirements lenc 


receiving inspection should be based on the lot-tolerance-consumer's risi 


Mm 


concept to provide lot by lot protection rather than over-all average 


protection 


5.4 Minimum Average Amount of Inspection per Lot-Minimu 


hi available 


Costs lo achieve the best possible qual Ol product wi 


funds and obtain the maximum allowable protit, inspection 
be minimized. The Dodge-Romig Inspection Tables have 


di) 1 
feature. Most of the other tables disresard inspection costs. Many conside: 


costs should 


included this 


that the cost ol inspecting rejected lots, screening them and classifving Une 


units as conforming and non-conforming is not to be considered. However, 


someone has to absorb this expense, hence, eventually unit costs will retlect 


and include these Inspection costs iso. as noted later in the discussion 


of the trinomial distribution, use mav be made of a form cl "purposive 
A 


sampling” that may greatly reduce inspection costs and provide betten 
process controls 
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Consider the simplest single sampling case. The average amount of 

inspection per lot, 1, for incoming quality p is obtained from the relations: 
I=n+(N—-nP,;I=n+(N —n) (1 — ES 

I=n+N-n-(N—nP,;Il=N-(N-—nmP, (22) 


where 


P.= E P., (23) 
¿=0 


= Ci (1—p)" * p' (positive binomial), (24) 


€ — PiRhion) bl - de 
AA (Poisson exponential), (25) 
7] 


1 a : 
A P= 4 bo e e => (hypergeometric). (26) 
Ya 


919) ) 


Using equations (22) and (25) together, assuming the Poisson exponential 


190 
o 
is a close enough approximation for evaluating probabilitics gives: 


PN on 


2) 


For a given lot size N for a selected AOQL value, say 1%, there exists a 
series of n, c values that provide this over all protection. For the current 
process averag( P which of these plans will make la minimum? 

One approach to a solution is to show a family of plans that provide 
the same AOQL value, let A 500, py 0.0l or 12,. A general relation 
for p, for single sampling is: 


l 
( +) (28) 
= 1 o 
PL Y A”. N 


where “Table 2-3 of Reference [1], p. 39 gives values of y for e values from 
O to 40 by units. The corresponding relation for » is 


y Ñ 


——_——— (29) 
P¿N +y 


For a process average ol (1) p U.001 0r U.I%, (2) p 0.005 
or 0.5%, (3) p 0.01 or 1.0%, (4) p 0.02 or 2.0%, (5) p 0.03 


( 
or 3.0%, and (6) p = 0.04 or 4.0%, which plan provides a minimum value 
for 1, the average amount of inspection per lot for p quality? The following 
table shows a large number of possible single sampling plans for a lot size 
ot N —= 500 units that result in an AOQL value of p, = 1.0%,. These 
sampling plans are denoted as (n,c) plans. For example for « O the 
plan might be written: A 000, NM ="39, 1 0, AOOL 19 
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SINGLE SAMPLING PLANS 


N = 500: AOQL = 1.0%, or pz = 0.01 
Determinztion of average amount of irsp:ction per lot T 
() p=0.1%, (2) p =0.5%, (3) p =1.0%, (4) p =2.0%, (5) Pp = 3.0%, 
and (6) p = 4.0%. 


pan ( 
I=N-—(N—=nm Po.P.= YE Pin (Probabilities based on Poisson expcnential) 
1 0 


1 - 


n ¿ 


1 ' yN 
— 3 - samplo size: == —=——— 


AOQL: pz PLN + y 


Accept- | Multi- entato Probability | Average | Probability | Average | Probabiity | Average 
ance | plying |” al d accept- | amount | of accept- | amount of accept- | amount 
number | factor . ance of inspec- ance of inspec- ance of inspec- 

tion tion tion 


P, l P, ] P, I 





(1) F=0.001 (2) F= 0.005 (3) p= 0.010 


965617 50.99* .839468 109. 705569 171. 
997522 73.06 . 948294 94. .837114 141.7: 
. 999806 108.08 .982121 115. .904273 145. 5% 
999986 140.01 . 994247 142, .946275 159. 
169.00 998169 169. 970978 178. 


.02 (5) p= 0.03 (6) p= 0.04 
496585 .350375 1 337. ¿246597 385.33 
.578230 | 252.! .364588 | 343. .217888 406.74 
633481 51.6 .371713 | 354,2 194912 423. 
691937 ; .395403 357. .190622 431.38 
.747864 | 252.! .428335 | 358.2: 196082 435.10 


803558 , 475027 354.6 .214265 434.43 
850932 .524955 351. .237526 433.78 
.894158 y 586796 345. .274968 427.41 
926527 27: 645422 341,2 .315123 422,48 
.951245 s . 104142 338. .362604 416.60 


969207 y .761135 | 335.5 .417698 409.78 
981637 Ti .814475 | 333.8: 480023 402.08 
998431 ! .949480 | 343.: 727191 380.01 
999970 ¿995137 | 368.6: .928183 377. 48* 


* Minimum Value. 


The table shown indicates the difficulty in generalizing concerning 
the most economical sampling plan for a given process average. When 
the AOQL value is less than the process average it is apparent that suf- 
ficient inspection and screening must be performed to maintain the P, 
equal to or less than the stipulated AOQL value. Where the process 
average is double the AOQL value / must at least equal N/2. As shown 


above this occurs for a fp, value approximately equal to p. For c = 3, 
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o 


2.95 and for n = 140, p, = 2.95/140 0.021. For larger 
values of p the minimum amount of inspection occurs when the c values 


== pin _ 


are large but the / values as computed are not much larger than also 


occur when c — 0. Note that / for p -= 0.03 is 337.08 for c = 0 and 


990c 


333.85 when c= 11. Also for p= 0.04 the £ value is 385.33 for c = 0 
and is 377.48 when c — 20. 

It must be also noted that initial unit costs of inspection may be 
more than may occur when all units in a lot are inspected 100%. However, 
many times 100%, does not remove all defective units since inspection for 
any continuous period of time is generally 90% or less efficient due to 
latigue factors, lack of interest in repetitive processes and the like. Sam 
pling inspection often affords more protection in many cases due to this 
lack of efficiency in inspections and tests, 


6. Variables Inspections and Tests 


The division of product into two classes: satisfactory and unsatistactory; 
good and bad; conforming and nonconforming; etc., has been the custom 
for most inspection processes. Less expensive testing and measuring devices 
are required for such a twofold classification. If actual measured values 
are desired, the apparatus and equipment used in testing must be more 
complex and sometimes replaces visual comparison with a standard. 
Variables measurements in other cases are just as easy to obtain as a 
twofold classification. Also variables data provide a measure of variability, 
which characteristic may be more important than the actual level, 


Variables inspection plans may be established using the same concepts 
of inspection as are used in the method of attributes. Some slight errors 
may be introduced by selecting the wrong distribution. However, the 
assumption of a normal distribution for averages is usually valid as skewness 
is measured by k/yn, where n is the sample size and k is the measure ol 
skewness for the original distribution. The following paragraphs deal 
briefly with inspection plans using variables measurements and criteria. 
For detailed tables it is better to check some of the referenced tables. 
The use of a variables inspection plan was first introduced in 1934 and 
was very successful. However, custom has been the guiding light and 
attributes inspection is generally used. 


6.1 Theory of Variables Sampling Plans. It is desired to have the 
same type of protection for variables inspection as for attributes inspection. 
Variables inspection has the disadvantage that it is only directly applicable 
to one characteristic at a time. Composite criteria may be established but 
this practice usually makes the inspection methods too complex for 
ordinary usage on the floor. It is feasible to establish criteria for major 
and minor items and also use a combination variables and attributes 
sampling plan that takes account of the best features of each. 
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Consider one characteristic such as resistance. The engineering limits 
for resistance are 95 ohms and 105 ohms, with an expected nominal value 
of 100 ohms. Measurements are made on 500 resistances covering 10 sets 
of 50 units each from 10 different lots. “The average is 100 ohms and 
the standard deviation is 2.50 ohms. If the distribution is symmetric 
and may be assumed to be a normal distribution, then probability values 
may be obtained, corresponding to t values computed as follows: 


(30) 


, ¿ , : 95—100 — 5 
From this relation for this example t e = e — 2.00, 


2.50 2.50 
105—100 , a 
or t= ——— = 2.00. For a normal law distribution for t = += 2 
2.50 
sigma then 95.45%, of the units are expected within the limits and 4.55% 
are expected to be outside the engineering limits. If the distribution had 


a level of X — 102.5 ohms, was still normal, then 


A e ia O. o AS e 
A 9 E 2.5 
Corresponding fp values would be: p, = 0.00135 and p2 = 0.1587, hence 
p = 0.16 or 16%, . Estimates of p can also be obtained from the actual 
observations. For a skew distribution this might be a better estimate of 
the expected value for fp. 


Limits for averages assuming a constant standard deviation value may 
be established; limiting values for averages and standard deviations or for 
averages and ramges may be used as criteria for additional inspection, 
rejection and/or acceptance. Final criteria might be based on defects 
observed while initial inspections are based on variables only. These 
criteria may be established to provide desired protection based on AQL, 
AOQL, or lot-tolerance—consumer's risk concepts. Operating characteristic 


curves may also be computed and drawn and will show the effectiveness 
of the different plans. 


6.2 Continuous Sampling. In attributes inspections, plans for 
continuous sampling have been developed based on the number of units 
that are selected from a continuous flow of product and inspected and 
which must contain no defects or detectives or only one defect or defective. 
Where defects occur too soon, then 100%, is required until the criterion 
for going to reduced inspection is satisfied. Pure sequential inspection can 
be done in variables inspection. Every unit can be measured and criteria 
established for average values for samples of 2, 3, 4, 5, etc. units. Ranges 
or standard deviations may also be computed. Criteria for these measures 
of variability may also be in effect. 
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For continuous production, moving averages alone, moving ranges 
alone, moving standard deviations alone, or any combination of these may 


be used. By a moving average for a sample ol n units is meant an average 
obtained from the measured values of the characteristic under consideration 
obtained from the first n units measured, and as additional consecutive 
units are measured for the characteristic under consideration, successive 
moving average values are obtained from successive sets ot n consecutive 
measured units. Thus, when another unit is measured, the value of the 
first unit measured 1s dropped and is replaced by the last measured value 
in determining an average value. “1 his practice is continued throughout 
the imspection. “The same procedure can be followed for ranges and 
standara deviations. Samples also may be taken at periodic mtervais when 
statistical control exists with respect to a given characteristic. 1 hese plans 
or combinations ot plans proviae very rigid controls over any process and 
reduce the cost ot imspections since more elticient use 19 made oi the 
available data. Smalier sample sizes are possible and when properly used 
will provide the same or better protection against the acceptance ot non- 
contorming units. 


lll. RELIABILITY SAMPLING 
Measures of Reliability and Confidence Limits 


Mean time between farlures (MIBF) has been used with the Poisson 
exponential distribution as a means ol obtaming a common measure tor 
renability. A new technique has been developea on the basis ol MI'BE 
values for evaluating the retiability of complex systems. Missiles, electronic 
equipments, and altied apparatus are measured and tested in accordance 
with the specitications prepared by the Military or prepared by contractors 
to meet the needs of the Government. Requirements for reltability are 
often written into the contracts or the specitications. Engineering depart 
ments add a small reliability group to evaluate their designs and recon 
mend improvements when design review boards find that designs may bi 
improved. 

Associated with these reliability values are confidence limits. These 
limits indicate the degree of belief that the  reliability values 
as computed will be at least that good P, per cent of the time. Many 
times confidence limits are not determined and in other cases these limits 
cannot be determined as no valid data are available. For example, if 900%, 
of the time our resistor with engineering limits 100 + 5 ohms is supplied 
within this band, 95 to 105 ohms, and the reliability of such resistors is 
95.459, these values may be used in evaluating the reliability of the system 
using these resistors. “The complete theory of reliability should be studied 
to truly appreciate these concepts. 
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Another measure of reliability in conjunction with confidence limits 
is obtained from the relation 


i=2 


E P;, n 
i 0 


P, = 
AÑ: 7 A 

where P, is the one-tailed confidence band and x in the numerator provides 
a measure of reliability. Different distributions, whichever are applicable, 
are used to evaluate the P,, values. A very few papers on reliability cover 
this measure. Its use indicates the necessity for securing measurements on 
as large a number of parts as possible to provide the reliability and confi- 
dence limits required by many contracts. 


Process Controls 


Various types of sampling must be used to obtain truly representative 
samples covering the characteristics and environments to be evaluated. 
Fhis section is brought in to emphasize the point that the whole is no 
better than its weakest part. Hence, process controls must be established . 
It is desirable to select those characteristics that are most critical, whose 
failure may cause a failure of the system as a whole or some important area 
and tabulate them in order of importance. Control charts for attributes 
or variables may be established. When these units have their important 
characteristics maintained consistently within their statistical control 
limits, then the process may be considered to be under control and valid 
predictions concerning future performances may be made. Reliabili y 
values based upon such parts and data will have meaning and reasonable 
confidence limits may also be determined. 


Trinomial Distribution For Reliability 


When parts have been tested and have been accepted as satisflactory, 
later tests will show that they may be classed as: 


I. Reliable, R,. 
1. Questionable, R., and 
Kn Unreliable, Ra. 


Those that have failed under the more stringent environmental and 
reliability tests will be eliminated. They should be destroyed if they cannot 
be used satisfactorily in some less critical service. Additional tests must 
be made on the questionable units so that those that are also unreliable 
may be eliminated. Only a small sample need be taken from the units 
classed as reliable to check the prior classification. To obtain over-all 
reliability values from test results, stratified random samples are taken 
from the first two universes. 
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If the relative occurrence of these is W,, Wa, and W., then the first 
estimate of reliability is: 


R = Wi; R, + W, R, + Wi Ra (32) 
The standard deviation gy is obtained from the relation: 


UE y W, “op + Wo “on: + Wi “OR; (33) 
where 
o, = VEU EJ] (34) 
For example if W, = 0.20, W, = 0.70 and W, = 0.10 with 
Ri, = 0.99, R¿ = 0.80, R¿ = 0.05, then per equations (32) and (33) 
R = 0.20 (0.99 + 0.70 (0.80) + 0.10 (0.05) 
= 0.198 + 0.560 + 0.0005 = 0.763 


or = Y (0.01)(0.99)(0.01)/n, +.(0.49)(0.80)(0.20)/m2 + (0.01)(0.05)(0.95)/n3 


Covering first the case where n; = M2 — Nz — 1 gives 





a; = V 0.000395+0.07844+-0.000475 = V 0.079771 = 0.2824 
Since the second term is 0.784, its square root is 0.280. Hence, it 
contributes practically all the variability. If the sample size is 100 for all 
then vr = 0.02824. Then the 3 — limits for R are: 
0.763 + 3 (0.02824) = 0.763 + 0.085, or 0.678 to 0.848. 
For the over-all reliability R = 0.763, with n = 100, 


— Y pa , : 
rg = V 0.763(0.237)/100 = ny v 0.180831 = 39 94252 = 0.04252. 


The 347 limits for R are: 
0.763 + 3 (0.04252) — 0.763 = 0.128, or 0.635 to 0.891. 


The use of the trinomial has reduced the variability without increasing 
the sample size. 

The use of the trinomial has been described elsewhere for attributes. 
It is necessary to keep accurate records and segregate product into three 
separate universes during processing. If this is done, better controls at 
less cost may be obtained in subsequent operations. 
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SUMMARY 


The need for an objective system of obtaining current 
statistics Of agricultural production has long been recognized 
in Brazil. The Production Statistics Service of the Ministry of 
Agriculture, with the cooperation of State and municipal agencies 
of the Brazilian Institute of Geography and Statistics, has been 
carrying out, since 1957, a program of surveys, using probability 
sampling techniques, for the purpose of determining area and 
production of wheat grown in the State of Rio Grande do Sul. 
These surveys have had two objectives: (1) To improve current 
statistics on wheat (Rio Grande do Sul accounts for about 80 
percent of Brazil's total wheat production) and (2) to obtain 
experience on which to base the future application of probability 
sampling methods to provide estimates for all principal crops 
on a nation-wide basis. 


The present article describes the investigation of the 1958 
crop. This investigation was conducted in three phases: (1) A 
survey of farms, immediately following the planting season, to 
determine area planted. (2) A survey of county agricultural 
agents and other informed persons, shortly before the harvest, 
to obtain predicted yields. (3) A survey of farms, immediately 
after the harvest, to determine actual production. The sample 
used in phases (1) and (3) was a probability sample of 
establishments, using as a frame a census of wheat producers 
taken in the previous year. This sample was supplemented by 
an area sample to insure coverage of new producers and those 
missed in the census. 


This article describes in detail the technical features of 
the sample design, collection ¡procedures and methods of 
estimation. Some of the principal results are also presented. It 
should be noted that, due to a variety of unfavorable conditions, 
the yield obtained in Brazil's 1958 crop was considerably below 
normal. 


* Relatório apresentado em julho de 1959 ao Servico de Estatística da Producáo do Ministério 
da Agricultura. 

.* Assessor em FEstatística junto ao Instituto Brasileiro de Geografia e Estatística (IBGE) 
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INTrrRODUCAO 


O levantamento feito por amostragem, da producáo de trigo no Rio 
Grande do Sul da safra de 1958, pertence a uma série de levantamentos 
que o Servico de Estatística da Producáo do Ministério da Agricultura vem 
realizando como parte de um plano de melhoria das estatísticas agrícolas 
brasileiras, visando a introducáo da amostragem em substituicáo gradativa 
ao processo subjetivo de estimativas feitas pelo Agente Municipal de 
Estatística. Neste trabalho faz-se uma exposicáo dos processos utilizados 
bem como das principais razóes que influiram no planejamento do inqué- 
rito. Embora náo seja objetivo déste documento a divulgacáo dos resulta- 
dos obtidos no referido levantamento, fazem parte dos “Anexos” alguns 
quadros apresentando as principais estimativas feitas. 

£ste relatório está redigido acompanhando o espírito que levou o 
estatístico sueco Tore Dalenius a escrever na introducáo ao seu livro 
Sampling in Sweden: Contributions to the Methods and Theories of 
Sample Survey Practice: “É típico dos problemas encontrados na execucáo 
de levantamentos estatísticos que éles precisam ser resoluidos, de uma ma- 
neira ou de outra. A procura de solucóes elegantes, embora seja uma 
tentacáo do ponto de vista estético, é de importáncia secundária.” 


II. RELACOES COM OS LEVANTAMENTOS ANTERIORES 


O inquérito por amostragem realizado para investigacáo da safra de 
trigo de 1958 foi baseado em grande parte no Cadastro de Estabelecimentos 
Produtores de Trigo organizado em 1957. O referido Cadastro foi orga- 
nizado por intermédio de um levantamento geral dos estabelecimentos 
produtores de trigo em 1957, com indagacáo entre outros dados da área 
cultivada com trigo naquela safra e vários elementos sóbre a safra de 1956. 
£ste levantamento geral foi mais detalhado para os estabelecimentos que 
cultivaram mais de 5 hectares na safra de 1957 ou na de 1956 e bastante 
resumido para os estabelecimentos cuja cultura de trigo náo atingiu aquéle 
limite. 


O inquérito de amostragem que vamos descrever neste documento foi 
o segundo baseado no referido Cadastro. O primeiro levantamento por 
amostragem foi realizado em janeiro de 1958, destinando-se a investigar a 
quantidade de trigo produzida na safra de 1957, complementando assim o 
conhecimento daquela safra, pois a área plantada com trigo fóra indagada 
de todos os estabelecimentos produtores por intermédio da operacáo 
cadastral. 


III. FINALIDADE DO LEVANTAMENTO 


O principal objetivo do inquérito foi o de fornecer estimativas sóbre 
o montante da safra de trigo, inquirindo-se, para isso, dados sóbre a área 
cultivada e sua parcela colhida, bem como sóbre a producáo obtida e a 
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parte comercializada dessa producáo. Desejava-se conhecer os dados de 
área e de producáo o mais cedo possível, o que acarretou a divisio do 
inquérito em duas fases. Coletando-se a primeira fase logo após o plantio 
e a outra pouco depois da colheita. 

Aproveitou-se O inquérito para proceder a várias experiéncias, necessá- 
rias ao plano de melhoria das estatísticas levantadas pelo Servico de Esta- 
tística da Producáo, tanto em referéncia a métodos quanto á profundidade 
de investigacio. 

Quanto a métodos procurou-se examinar a possibilidade de, com os 
recursos atualmente existentes, utilizar-se uma amostra de áreas conjugada 
com uma amostra de um cadastro baseado na safra anterior a fim de se 
obter estimativas referentes ao total da safra, isto é, estimativas que incluis- 
sem a producáo dos estabelecimentos náo cadastrados. Procurava-se tam- 
bém obter com o uso dessa amostra de áreas uma avaliacio do grau de 
omissáo apresentado pelo Cadastro dos Produtores de Trigo em 1957. 

Quanto á profundidade de investigacio, desejou-se verificar se era 
possível obter-se, sem grandes erros, detalhes agronómicos como discrimi- 
nacáo das informacóes segundo as variedades cultivadas e pesquisa da 
época de plantio dessas variedades. 

Outra experiéncia foi o lancamento de um “inquérito de opinióes” 
feito a agrónomos nos municipios produtores, sóbre o rendimento cultural 
esperado para a safra, pouco antes da colheita. Éste inquérito se destinava, 
comparados os seus resultados com a producáo obtida na safra, á verifica- 


cáo da possibilidade de se usar inquéritos déste tipo para fornecer-se pre- 
visóes de safras, aplicando-se os seus resultados a levantamentos por 
amostragem da área plantada. 


IV. FATÓRES QUE INFLUIRAM NO PLANEJAMENTO DA AMOSTRA 


Vários fatóres, técnicos e económicos, influiram no tamanho e no 
plano da amostra. Entre os fatóres técnicos citaremos os seguintes: 


Necessidade de serem fornecidas estimativas de área cultivada, logo após o plantio, 
e de quantidade produzida, pouco depois da colheita, obrigando ao lancamento do 
inquérito em «duas fases 


A utilizacáo de um cadastro de estabelecimentos produtores, organizado para a 


safra anterior, levando ao emprégo adicional de uma amostra de áreas para a determi- 
nacáo da parcela da safra náo compreendida naquele Cadastro. 

Mapas municipais bastante deficientes náo fornecendo elementos fidedignos e 
suficientes para a delimitacío de áreas de amostra de tamanho adequado, provocando 
o uso na amostra de áreas, de um pequeno número de grandes áreas em vez de, 
como seria desejável, um maior número de pequenas áreas 

Limite máximo desejado de érro de 5% para a estimativa do total 


( 


da safra, 
determinando a necessidade de emprégo de uma amostra dos estabelecimentos cadas 


trados aue fornecesse um érro provável em tórno de 3% como medida de seguranca, 
desde que a parcela da safra estimada por intermédio da amostra de áreas deveria 
forcosamente apresentar um érro elevado e de difícil previsio 

Entre os fatóres económicos destacaremos a verba disponível, que embora pequena, 


permitiu um aumento substancial no tamanho da amostra em relacáo ao inquérito do 
ano anterior. 
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Ainda ligado a ésses fatóres temos que nos referir á forma de paga- 
mento aos Agentes Municipais por intermédio de diárias, que contribuiu 
grandemente para o uso de conglomerados pois que isso diminuiria o 
deslocamento dos coletores de dados dentro dos municípios. A utilizacáo 
de uma amostra simples de estabelecimentos que fornecesse o mesmo érro, 
embora constituída de menor número de estabelecimentos, implicaría ainda 
assim uma grande movimentacáo dos Agentes, inconvenientes náo apenas 
sóbre o ponto de vista do aumento de despesas mas principalmente por 
provocar a necessidade de pagamento de diárias em número superior ao 
que as disposicóes do Instituto Brasileiro de Geografia e Estatística (1BGE) 
permitem ordinariamente sejam concedidas aos seus Agentes, além de de- 
terminar o afastamento désses funcionários de sua sede por tempo que 
afetaria a boa marcha dos outros servicos a seu cargo. 


V. Uso DE CONGLOMERADOS 


Tendo se modificado neste levantamento algumas das razóes que nos 
levaram á preferéncia, no inquérito anterior, por conglomerados sera maio- 
res exames, resolveu-se proceder a alguns estudos sóbre a conveniéncia 
de usar ou náo conglomerados. Já, com a finalidade de obter elementos 
para fazer um julgamento sóbre se o uso de conglomerados propiciava 


economia apreciável na coleta, tiínhamos solicitado dos Agentes na amostra 
de 1957, dados sóbre o tempo gasto em deslocamento até o conglomerado 
e entre os elementos do conglomerado. Essas informacoes seriam básicas 
para o cálculo do custo da coleta, tanto numa amostra de conglomerados 
quanto numa amostra simples. 


Calculou-se a variáncia da amostra de conglomerados usada em 1957 
e a variáncia de uma amostra aleatória simples com o mesmo número de 
estabelecimentos. Relacionando as variáncias das duas formas de amostra 
chegamos a uma razáo que nos pareceu sempre inferior a que se obteria 
pela relacáo inversa dos custos das duas formas de amostra. Éste foi um 
dos motivos que nos féz preferir utilizar conglomerados como unidades de 
amostragem no inquérito de 1958. Outros motivos contribuiram também 
para esta preferéncia, como: os bons resultados propiciados pela amostra 
a base de conglomerados utilizada no inquérito anterior, tanto em relacáo 
a estimativa dos dados quanto á facilidade de execucáo; e utilizacáio dos 
Agentes Municipais na coleta dos dados, o que ao mesmo tempo que nos 
assegurava elementos de boa qualificacáo, proporcionava-nos uma coleta 
menos dispendiosa. 


VI. PLANO DO INQUÉRITO 


Como já foi dito anteriormente, o inquérito foi executado em duas 
fases: A primeira fase, em que se desejava conhecer os dados sóbre o plantio 
de trigo, foi lancada em setembro; a segunda fase, em que se indagou sóbre 
a producáo, foi coletada em janeiro de 1959. Na primeira fase foram em 
pregadas duas amostras: amostra de estabelecimentos cadastrados em 1957 
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e amostra de áreas. Na segunda fase utilizou-se uma subamostra retirada 
das amostras usadas na primeira fase. 


VII. ESQUEMA DAS AMOSTRAS E SUBAMOSTRA 


1. Amostra de estabelecimentos cadastrados. Esta amostra foi reti- 
radarada do “frame” oferecido pelo Cadastro de Trigo de 1957 realizado 
pelo Servico de Estatística da Producío, que era constituído por estabele- 
cimentos que cultivaram trigo em 1957 ou 1956. Foi uma amostra siste- 
mática de conglomerados de estabelecimentos. Apresentava duas estratifi- 
cacóes: estratificacio geográfica e estratificacío dos estabelecimentos por 
extensáo de área cultivada com trigo. 


2. Amostra de áreas. Destinada á investigacáio dos estabelecimentos 


náo cadastrados (estabelecimentos novos e estabelecimentos omitidos no 
Cadastro), era constituida de áreas selecionadas e perfeitamente delimitadas 
em mapas, localizadas sempre dentro de um distrito. O esquema utilizado 
foi o de uma amostra em vários estágios, com uma estratificacáo geográfica 
das unidades primárias (municipios), selecáo de uma unidade primária 
por estrato com probabilidade proporcional á área cultivada com trigo 
em 1957 e subamostragem para selecáo de uma pequena área em cada 
unidade primária selecionada. 


3. Subamostra. Era constituida de duas partes distintas, extraídas 
das amostras empregadas na primceira fase do inquérito: (a) Parte formada 
por estabelecimentos cadastrados. Esta parte da subamostra foi retirada 
da amostra de estabelecimentos cadastrados. Como ela, constituiu-se de 
conglomerados de estabelecimentos, mantendo as mesmas estratificacóes. 
(b) Parte formada por estabelecimentos náo cadastrados. Extraída 
da amostra de áreas, esta parte era composta de estabelecimentos isolados, 


selecionados sistemáticamente dentro de estratos organizados segundo a 
extensáo da área cultivada com trigo. 


VIII. 'TAMANHO DAS AMOSTRAS E SUBAMOSTRAS 


Vários fatóres influiram na determinacáo do tamanho das amostras, 


como já expusemos no tópico “Fatóres que influiram no planejamento da 
amostra.” 


1. Amostra de estabelecimentos cadastrados—usou-se uma amostra 
constituida por 1.869 estabelecimentos. 


O tamanho desta amostra pode parecer excessivo para as pessoas que 
tomaram conhecimento do inquérito feito sóbre a safra anterior. Naquela 
operacáo usou-se uma amostra de 307 estabelecimentos que forneceu uma 


estimativa da producáo com um coeficiente de variacáo de 6%,. Neste 
levantamento, desejando-se um coeficiente de variacáo de 3%, para a área 
cultivada com trigo nos estabelecimentos cadastrados, elevou-se o tamanho 
da amostra para cérca de 2.000 estabelecimentos. É necessário, porém, ad- 
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vertir que a amostra do ano anterior destinava-se a estimar a producáo da 
salra de 1957, tendo sido escolhida com base na área cultivada daquela 
mesma safra obtida no “Cadastro de Trigo de 1957,” portanto sendo de 
estreita correlacáo os dados que se pretendia estimar e os que lhe serviriam 
de base para a escolha da amostra e para a estimativa de razáo empregada; 
ao passo que na amostra déste ano os dados a estimar—producáo e área 
cultivada em 1958, náo mantinham uma correlacáo táo grande com o 
dado básico—área cultivada na safra de 1957, usado para a escolha da 
amostra e a estimativa de razáo. 


Chegou-se ao tamanho da amostra da seguinte forma: Foi escolhido 
como tamanho básico da amostra o de 2.000 estabelecimentos, levando-se 
em conta os fatóres de custo e tempo necessário para a coleta e o fato de 
se desejar obter dados com érro de amostragem de aproximadamente 3% 
Repartiu-se éste número básico pelos estratos de área cultivada com trigo, 
proporcionalmente ao tamanho em relacáo á área cultivada com trigo em 
1957 de cada estrato. Éste processo corresponde á reparticio de Neyman 
admitindo-se como constante a variáncia relativa dos estratos. Obteve-s 
desta forma: 


Número de 
ESTR estabele- 


cimentos 


De menos de 5 ha h 454 
De 5 a menos de 20 ha 308 
De 20 a menos de 500 ha 1 044 
De 500 ha e mais 164 


Calculou-se em seguida o intervalo de selecáo de cada estrato, divi 


dindo-se o número total de estabelecimentos do estrato pelo número d 


estabelecimentos da amostra no estrato de acórdo com a reparticio feita 


Obteve-se assim intervalos quase sempre frac ionários, adotando-se para 


facilidade de trabalho o número conveniente mais próximo. O fato de que 
no último estrato o número de estabelecimentos calculado na reparticio 
foi superior ao número existente no estrato, indicou imediatamente a ne- 
cessidade de serem todos éles incluídos na amostra. 


INTERVALOS 
ESTRATOS 


Calculados| Adotados 


De menos de 5 ha 246,0 300 
De  5a menos de 20 ha 60,5 50 
De 20 a menos de 500 ha 4,6 5 


De 500 ha e mais 0,7 
A A 


Como é evidente a utilizacáo déstes intervalos ajustados náo fornecerta 
o mesmo número de estabelecimentos calculado para os estratos na pri- 
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meira reparticio. Foi, entáo, calculada a esperanca matemática do tamanho 
da amostra, com base nos intervalos escolhidos, encontrando-se: 


Número de 
ESTRATOS estabele- 
cimentos 


menos de 5 ha ¿ 399 
5 a menos de 20 ha 369 

20 a menos de 500 ha 966 

> 500 ha e mais........ a 119 


TOTAL Es 1 853 


No entanto, a aplicacio dos intervalos escolhidos, para selecáo dos 
conglomerados nos trés pr imeiros estratos, ocasionou uma pequena variacáo 
no tamanho total da amostra. As principais causas dessa variacáo foram: 
(a) Variacáo de tamanho dos conglomerados que continham de 4 a 6 
estabelecimentos. (b) Processo empregado para selecáo em alguns estra- 
tos, em que em primeiro lugar foram escolhidos os municípios com proba- 
bilidade proporcional á área cultivada, selecionando-se em seguida os con- 
eglomerados dentro dos municípios, segundo uma taxa igual a taxa geral 
dividida pela probabilidade de selegáo do municipio. 

Depois de selecionadas as unidades a amostra ficou com o seguinte 
tamanho distribuído pelos estratos: 


Número de 
ESTRATOS estabele- 
cimentos 


De menos de 5 ha.. ¡ 450 
De 5 a menos de 20 ha 361 
De 20 a menos de 500 ha 939 
De 500 ha e mais 119 


TOTAL 1 869 


Éstes estabelecimentos estavam distribuídos nos trés primeiros estratos 


em conglomerados, no último estrato náo foram organizados conglomerados 
porque a investigacáo se féz em todos os estabelecimentos. O número de 
conglomerados foi o seguinte: 


Número de 
ESTRATOS conglo- 
merados 


De menos de 5 ha 90 
De 5 a menos de 20 ha 75 
De 20 a menos de 500 ha 204 


TOTAL 369 
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Dessa forma a amostra de estabelecimentos cadastrados foi de 1.869 esta 
belecimentos, composta de 1.750 estabelecimentos com menos de 500 hec- 
tares agrupados em 369 conglomerados e 119 estabelecimentos com 500 
hectares e mais. 


92. Amostra de áreas. Esta amostra foi constituida de 30 áreas dis- 


tribuídas em 29 municípios. 


Na determinacáo do tamanho desta amostra foram considerados vários 
fatóres, conforme nos referimos no tópico “Fatóres que influiram no pla- 
nejamento da amostra.” Os principais fatóres foram, o material cartográfico 
de pouca prec isáo, náo permitindo o uso de áreas pequenas, o custo elevado 
do levantamento das áreas escolhidas, a necessidade de utilizacio do Agente 
Municipal como entrevistador e o pequeno tamanho relativo da parcela 
da safra que deveria sen medido por esta amostra. Foi utilizado o critério 
de selecáo que pareceu ser o mais adequado aos objetivos da amostra (ver 
O tópico “Selecáo das Amostras e Subamostra”) levando-se em conta a ne- 
cessidade de uma maior concentracáo na amostra, das áreas de maior pro- 


babilidade de aparecimento de novos estabelecimentos e de ocorréncia de 
omissoes no “Cadastro de Trigo de 1957.” 


3. Subamostra. Adotou-se o tamanho de 500 estabelecimentos para 
a subamostra destinada a fornecer estimativas para a producáo da safra. 


A escolha de um pequeno tamanho foi determinada pela necessidade 
de trabalhar com uma amostra que despendesse pouco tempo na coleta 
e na estimacáo dos dados. O número de 500 estabelecimentos foi adotado 


seguindo o raciocínio de que uma amostra um pouco maior do que a 


de 300 estabelecimentos utilizada no ano passado, que apresentou um coe- 


liciente de variacáo de 6%, poderia oferecer um érro relativamente baixo, 


principalmente pelo fato de ter sido utilizada neste ano melhor estrati- 
licacáo 

Note-se que o caso da subamostra é semelhante ao da amostra do ano 
passado, porque em ambos os imquéritos se pretendia estimar a producáo 
de uma safra usando como dado básico a área cultivada da mesma safra, 
náo só para a selecáo das unidades da amostra mas também em relacáo 
á estimativa de razáo empregada. 


Reparticio da subamostra—Féz-se primeiramente a reparticio pelas 
duas amostras empregadas na primeira fase do levantamento e depois dis- 
tribuiu-se os valores encontrados pelos estratos de área cultivada com trigo 
em 1958. A reparticio pelas duas amostras foi feita com base nas estima- 
tivas preliminares de área cultivada com trigo na saíra de 1958, para as 
parcelas representadas por cada uma das amostras utilizadas. Náo se póde 
dispor, nesta primeira estimativa, de um valor preciso para a área cultivada, 
em virtude de existirem alguns casos a serem solucionados, relativos a 
estabelecimentos da amostra de áreas, que influíam bastante 
resultados. 


sóbre os 


Como náo era possível aguardar os dados solicitados á réde de coleta 
do IBGE, a fim de fazer as estimativas preliminares, resolveu-se proceder 
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a estimativas de acórdo com as hipóteses possíiveis. Dessa forma verificou-se 
que a área cultivada com trigo nos estabelecimentos náo cadastrados, esti- 
mada por intermédio da amostra de áreas, estava compreendida entre 1/4 
e 1/6 da área de trigo do total de estabelecimentos. Admitiu-se entáo o 
valor intermediário. Assim tivemos: Az = 4A, em que A representa a 
área cultivada com trigo em 1958 e os índices 2 e 1 respectivamente estabe- 
lecimentos cadastrados e estabelecimentos náo cadastrados. 


Utilizando-se a reparticio de Neyman: 


UN N,o AV, 


—  _ SÁ endo V¿= E 
n Ni, + N¿03 As V; + A9Voa PP. 


em que Aj, representa a área média por estabelecimento. Para a hipótese 
As» =1A1 tivemos: 


My e A V , As V, 


7 A¡V, + 44,V» sh A¡(V, + 4 Vo) 


Considerando que o coeficiente de variacáo da amostra de áreas de- 
veria ser maior que o da amostra do Cadastro, Y, > Y, construimos duas 
hipóteses: 


n 
Para V, —2V.,, teríamos — 


n 


, , UN 
Para Y, 1V., teríamos 
n 


Concluimos, portanto, que o número de estabelecimentos da amostra 
de áreas na subamostra estaria compreendido entre 250 e 166. Tomamos 
o tamanho intermediário de 200 estabelecimentos da amostra de áreas, O 
que determinou para a amostra do Cadastro o número de 300 estabeleci- 
mentos. Uma vez repartido o tamanho da subamostra pelas duas amostras, 
passamos a calcular a reparticáo por estratos de área cultivada com trigo. 
Para a amostra do cadastro o cálculo foi o seguinte: Foram organizados 
5 estratos: De menos de 5 hectares; de 5 a 20 hectares; de 20 a 500 hectares; 
de 500 a 1.000 hectares; e de 1.000 hectares e mais. 


Todos os estabelecimentos com 1.000 hectares e mais foram incluídos 
na subamostra. O número restante de estabelecimentos do Cadastro na 
subamostra foi repartido pelos 4 primeiros estratos proporcionalmente á 
área cultivada com trigo. Esta reparticáo corresponde a de Neyman su- 
pondo-se constantes as variáncias relativas dos estratos. Feito isto, calculou- 
se o intervalo de selecáo, dividindo-se o número de estabelecimentos na 
amostra pelo número na subamostra para cada estrato, ajustando-se Os 
valores encontrados para números inteiros próximos. 
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Número de | Número de 
ESTRATOS DE ÁREA estabele- estabele- 


CULTIVADA COM TRIGO e se” 


amostra subamostra 


Intervalo 
de selegáo 


Menos de 5 ha.... 450 
De 5 a menos de 20 ha 361 
De 20 a menos de 500 ha 939 
De 500 a menos de 1.000 ha 110 
De 1.000 ha e mais. 9 


Para a amostra de áreas procecdeu-se da seguinte forma: Preparou-se 
uma tabulacáo dos estabelecimentos na amostra de áreas por 4 estratos 
de área cultivada com trigo: menos de 5 hectares; de 


5 a 20 hectares; 
de 20 a 500 hectares; e de 500 hectares + mais. 


AMOSTRA DE ÁREAS 


ESTRATOS DE ÁREA in 
CULTIVADA COM TRIGO | Número de rea st = 
trigo em 1958 
estabele- 


cimentos Hectares | % do total 


id! 


De menos de 5 ha... 5 1 186 


De 5 a menos de 20 ha . 1 485 

De 20 a menos de 500 ha ) 8 488 

De 500 ha e mais....... 2 180 
ty 


TOTAL : 13 339 


Do quadro acima verifica-se claramente a vantagem da inclusáo inte- 
gral na subamostra de todos os estabelecimentos dos grupos de 20 a 500 ha 
e de 500 ha e mais que perfaziam 809%, da área total cultivada com trigo. 
Éstes dois grupos foram incluídos integralmente, distribuindo-se os esta- 
belecimentos restantes desta parte da subamostra pelos dois primeiros 
estratos proporcionalmente á área cultivada com trigo, conforme se pode 
observar no quadro abaixo. 


Número de 

ESTRATOS DE ÁREA | Intervalo | estabele- 

CULTIVADA COM TRIGO | de selegáo | cimentos 
na 

subamostra 


De 5 a menos de 20 ha. 
De 20 a menos de 500 ha 
De 500 ha e mais 
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IX. SELEGAO DAS AMOSTRAS E SUBAMOSTRA 


Foram utilizados processos diferentes para a selecío de cada uma das 
amostras e subamostra empregadas. Descreveremos a seguir os métodos 
usados nesta selecáo: 


1. Amostra de estabelecimentos cadastrados. A operacáo se realizou 
em 4 fases. Primeiramente foram estratificados os municipios, selecionan- 
do-se um em cada estrato, em seguida foi feita, nestes municipios, uma 
estratificacáo dos estabelecimentos segundo a extensáo da área cultivada 
com trigo, fazendo-se depois a selegáo de localidades (distritos, subdistritos 
e áreas menores) onde seriam retirados os conglomerados, finalmente, foram 
selecionados os conglomerados, nas localidades escolhidas, sistemáticamente, 
dentro de cada estrato e grupo de municipios (A ou B). Daremos a seguir 
os detalhes de cada uma das fases citadas: 


a. Selecáo de municipios. Para a selecáo dos municipios pro- 
cedeu-se da seguinte forma: Elaborou-se uma listagem dos municipios 
do Rio Grande do Sul, em ordem decrescente de área cultivada com 
trigo em 1957, segundo o cadastro. Verificou-se que um número rela- 
tivamente pequeno de municípios totalizava uma grande parte da 
área total cultivada com trigo em 1957 no Estado. Resolveu-se entáo, 
adotar 2 grupos de municípios para representar todo o Estado; ésses 
grupos seriam compostos de municípios que entrariam com certeza na 
amostra (grupo A) e de municípios que seriam selecionados entre os 
que restassem (grupo B). 


Para a determinacáo do núm«.o de municípios que entrariam na 
amostra bem como a reparticáo ótima entre os grupos A e B foi feito um 
pequeno estudo estatístico baseado na variáncia relativa entre os municipios 
do Estado. Determinou-se assim, um tamanho de 60 municipios, 45 perten- 
centes ao grupo A e 15 ao grupo B, reparticáo essa que fornecia a menor 
variáncia possível para o tamanho escolhido. Assim, da listagem previa- 
mente elaborada selecionou-se os 45 primeiros municípios que constituiram 
o grupo A e passou-se a selecáo, entre os 73 municípios restantes, dos 15 
relativos ao grupo B. 


Note-se que, dos 73 municípios restantes, apenas aquéles que possuiam 
uma área cultivada com trigo em 1957 maior do que 50 ha, (63 municípios), 
tiveram uma chance de selecáo. Ésses 63 municipios foram grupados em 
15 estratos, usando-se a área cultivada com trigo (em hectares) em 1957, 
como medida de tamanho. 


A base primária para a estratificacáo foi a localizacáo geográfica dos 
municípios, funcionando a razáo entre as áreas cultivadas com trigo em 
1957 e 1956 como uma base secundária. Em 3 casos, pares de municípios 
foram associados para formar uma unidade primária da amostra (muni- 
cípios) porque o número de produtores em ambos os municípios era muito 
pequeno. De cada estrato foi escolhida uma unidade primária por selecáo 
controlada, adotando-se probabilidade proporcional ao total da área culti- 
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vada com trigo em 1957 e contróle pela razáo entre as áreas cultivadas com 
trigo em 1957 e 1956. Éste procedimento resultou na selecáo de 15 unida- 
des primárias de amostragem, com 17 municípios, perfazendo um total de 
62 municípios na amostra, com os 45 municípios do grupo A. 


b. Estratificacáo por área cultivada com trigo. Selecionados os 
municipios, procedeu-se a uma estratificacio de estabelecimentos com 
base na área cultivada com trigo em 1957. 


Quatro foram os estratos 
adotados: 


Estrato 1 — menos de 5 ha 

Estrato 2 — de 5 ha a menos de 20 ha 
Estrato 3 — de 20 ha a menos de 500 ha 
Estrato 4 — de 500 hectares e mais 


c. Selecáo de localidades e de conglomerados. A selecáo da 
amostra de estabelecimentos do Cadastro foi feita em cada estrato, e 
dentro dos grupos de municípios A e B selecionados. Foram utilizados 
processos diferentes para os estratos, devido á variacáo dos elementos 
básicos fornecidos pelo Cadastro, á fracáo de amostragem diferente 
para cada estrato e ao fato de serem utilizados como unidades de 
selecáo conglomerados nos 3 primeiros estratos e estabelecimentos no 
último. 

Estrato I—menos de 5 ha cultivados com trigo em 1957. Uma 
lista foi preparada mostrando o número de estabelecimentos nesta 
classe, por município, distrito, subdistrito ou outra área qual- 
quer; ésses números foram acumulados para servirem a posterior 
selecáo de localidades e conglomerados. Daremos em seguida um 
trecho desta lista como ilustracáo: 


Número de | Número 
LOCALIDADES estabele- | acumulado 
cimentos | de estabele- 

cimentos 


CRUZ ALTA 
Cruz Alta (1.2 distrito-sede) 
Cadeado (2.2 distrito) 
Fortaleza dos Valos (3.2 distrito) 
Pejugara (4.2 distrito) a 
Santa Bárbara do Sul (5.2 distrito) 
Santa Clara do Ingaí (6.* distrito) 


BAGÉ 
Bagé (1.2 distrito) 


1.2 subdistrito 
2. subdistrito 
3.2 subdistrito.. 


Aceguá (2.2 distrito) 


1. subdistrito... de 
2.2 subdistrito............ 
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No grupo A (45 municípios) foi feita uma selegáo sistemática de 
localidades (distrito, subdistrito ou outras áreas menores) com probabili- 
dade proporcional ao número de estabelecimentos em cada localidade 
usando-se o intervalo de 1.500. Esse intervalo foi obtido multiplicando-se 
a recíproca da fracáo de amostragem para éste estrato que era de 300, 
por 5—número de estabelecimentos em um conglomerado, porque preten- 
dia-se selecionar 1 conglomerado em cada intervalo. Escolheu-se aleatória- 
mente um valor compreendido entre 1 e 1.500, valor ésse inicial da série 
que se determinou somando-se sistemáticamente o intervalo 1.500. Por 
ésse procedimento ficaram selecionados 47 localidades (distritos, subdistri- 
tos, etc.), dentro das quais foram selecionados os conglomerados. 

No grupo B (17 municípios) também foi feita uma selecáo de locali- 
dades com probabilidade proporcional ao número de estabelecimentos. A 
selecáo foi sistemática, usando-se em cada município o intervalo 1.500 P,, 
onde P, é a probabilidade de selecáo do município. A selecáo foi contínua 
de um município a outro, fazendo-se os ajustamentos necessários para a 
selegpáo da primeira localidade em cada município em virtude de variarem 
os intervalos de selecáo de um município para outro. 

Tivemos por ésse procedimento a selecáo de 43 localidades. Para 
cada localidade selecionada, em ambos os grupos A e B, foram identificadas 
tódas as listas coletivas que continham estabelecimentos daquela localidade. 
Escolheu-se entáo, aleatóriamente, em cada localidade, uma lista coletiva 
e um número (1 a 20) da linha dentro de cada lista. Foram selecionados 
assim, 90 conglomerados num total de 450 estabelecimentos, pois todos os 
conglomerados désse estrato eram formados de 5 estabelecimentos. 


Estrato 2—de 5 a menos de 20 ha cultivados com trigo em 
1957. Uma lista foi preparada mostrando o número de estabele- 
cimentos nesta classe por localidade (distrito, subdistrito ou áreas 
menores). Os estabelecimentos de cada localidade foram grupados 
em conglomerados, segundo um plano previamente estabelecido. 


Éste processo foi adotado a fim de propiciar a selecio de conglomera- 
dos compostos de estabelecimentos próximos entre si e situados em uma 
mesma localidade. O plano adotado foi o seguinte: Determinou-se o 
número de conglomerados, dividindo-se o número de estabelecimentos da 
localidade por 5. No caso de quociente fracionário tomou-se o número 
inteiro imediatamente superior. Nestes casos em que a divisáo náo era 
exata os últimos conglomerados foram formados de 4 estabelecimentos, a 
fim de determinar o número déstes conglomerados menores, subtraiu-se de 
5 o resto encontrado na divisáo para determinacáo do número de con- 
glomerados. Quando a localidade tinha menos de 12 estabelecimentos náo 
foi aplicado o processo geral, adotando-se a equivaléncia entre número 


de estabelecimentos e formacáo de conglomerados, que se apresenta na 
tabela seguinte: 
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Número de Número de Arranjos de 
estabelecimentos| conglomerados | conglomerados 


As localidades e os conglomerados foram selecionados da seguinte 
maneira: 


No grupo A foi feita uma selecáo sistemática de conglomerados usan- 
do-se um início aleatório e o intervalo de 50 de acórdo com a fracáo de 
amostragem determinada para éste grupo. “Tendo-se em conta que os 
conglomerados foram organizados por municipios e localidades, éste pro- 
cesso teve o efeito de uma estratificacáo geográfica. A selecáo forneceu 66 
conglomerados em 65 localidades pertencentes a 37 dos 45 municipios for- 
madores do grupo. 


Nos municípios escolhidos do grupo B a selecáo obedeceu a processo 
semelhante. A única diferenca residiu no fato de se utilizar intervalos de 
selecáo variáveis por municipio. A variacáo dos intervalos foi necessária 
a fim de assegurar a mesma probabilidade geral de selecáo, que era com- 
posta pela probabilidade de selecáo do município e a probabilidade de 
selecáo do conglomerado dentro do município. A selecáo foi contínua de 
um município a outro, fazendo-se os ajustamentos necessários para a es- 
colha do primeiro conglomerado em cada município em virtude de varia- 
rem os intervalos de selecáo de um municipio para outro. Foram selecio- 
nados por ésse processo 9 conglomerados localizados em 9 dos 17 municipios 
selecionados representativos do grupo B. 


Daremos a seguir, como ilustracáo, um trecho do mapa de selecáo do 
grupo A. 
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ESTRATO 2. ESTABELECIMENTOS DE 5 A MENOS DE 20 HECTARES 
DE ÁREA CULTIVADA DE TRIGO EM 1957 


A A tl E o + 
DISTRITOS , ar conglomerados | + mu/ado de | conglomerado 
cimentos 'onglomerados | selecionado 


Cruz Alta 


A 
B 
C 
D 


» 


Estrato 3—Estabelecimentos de 20 a menos de 500 hectares de 
área cultivada com trigo em 1957. Os métodos de selecáo e for- 
macáo de conglomerados neste estrato foram idénticos aos usados 
no estrato anterior. A única modificacáo consistiu no intervalo 
adotado neste estrato, que foi de 5 para o grupo A e 5 P, para 
o grupo B. Foram selecionados no grupo A, 184 conglomerados, 
situados em 114 localidades, em 41 dos 45 municípios e, no grupo 
B, 20 conglomerados em 17 localidades pertencentes a 9 dos 17 
municípios representativos do grupo. 


2. Amostra de áreas. A selecáo das áreas de amostra foi feita em 3 


etapas. Na primeira etapa selecionou-se uma subamostra dos municípios 
que foram incluídos na amostra do Cadastro. Na segunda etapa foi sele- 
cionado um distrito de cada municipio desta subamostra, excetuando-se o 
município de Cruz Alta em que foram selecionados dois distritos. Na ter- 
ceira etapa os distritos sezecionados foram divididos em áreas menores, 
selecionando-se uma destas áreas para cada distrito. A subamostra de mu- 
nicípios foi escolhida da seguinte maneira: 


a. Grupo “Certo.” Neste grupo foram considerados os muni- 
cípios que apresenvavam gwande incremento na área cultivada com 
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trigo entre 1956 e 1957. O incremento total para todo o Estado foi 
aproximadamente de 231.000 ha. A trigésima parte dessa diferenca 
(30 áreas foram escolhidas) era 7.700 ha. Tomou-se entáo o limite 
inferior para ésse grupo em 6.000 ha, sendo que 9 municípios possuiam 
incremento maior que o limite, e foram todos incluídos na subamostra 
com probabilidade de um. Seis municipios com suspeita de omissáo 
de estabelecimentos no Cadastro também foram incluídos na subamos- 
tra com probabilidade de um, embora o incremento tenha apresentado 
um valor menor que o limite determinado. 


b. Grupo “náo-certo.”  Selecionados os 15 municipios do grupo 
“Certo” entre os 45 municipios do grupo A, da amostra do Cadastro, 
procedeu-se ao grupamento dos 30 municipios restantes, com base na 
localizacáo geográfica, em 9 estratos, usando-se a diferenca da área 
cultivada com trigo entre 1956-1957 como uma medida de tamanho. 
Um municipio foi entáo selecionado, aleatóriamente, com probabili- 
dade proporcional á referida medida, para representar cada estrato. 
Os 15 estratos do grupo B foram agrupados, usando-se a diferenca 
de área cultivada com trigo entre 1956 e 1957 como uma medida para 
formar 5 grandes estratos. De cada um dos 5 grandes estratos, selecio- 
nou-se um estrato original com probabilid: ade. proporcional ao tama- 
nho. A unidade primária (município ou par de municipios) que na 
amostra do Cadastro representara o estrato selecionado passou a re- 
presentar também o grande estrato da amostra de áreas. Em resumo 
a selecáo forneceu 15 unidades primárias no grupo “Certo” e 14 no 
grupo “náo certo,” totalizando 29 unidades primárias com 30 muni- 
cípios na amostra de áreas. 


Selecáo de distritos 


Um distrito foi selecionado de cada unidade primária com probabili- 
dade proporcional ao tamanho. Estabeleceu-se uma única excecáo para 
o municipio de Cruz Alta, em que dois distritos foram selecionados em 
vista do grande incremento apresentado por éste município. A medida 
de tam: ho usada para essa selecáo foi a diferenca entre a superfície do 
distrito e uma estimativa da área total ra estabelecimentos produtores 
de trigo cadastrados em 1957 no distrito. A superfície de cada distrito foi 
avaliada pela planimetracáo feita no melhor mapa disponível do município. 

A área total dos estabelecimentos cadastrados foi assim obtida: Para 
os estabelecimentos que plantaram 5 hectares ou mais com trigo em 1956 
ou 1957, o valor total foi dado pela soma das áreas totais de todos os esta- 
belecimentos do distrito. Para os estabelecimentos com menos de 5 hecta- 
res cultivados com trigo foi feita uma estimativa da área total dos estabe- 
lecimentos, tendo em vista de que o Cadastro investigara éste dado apenas 
para uma amostra constituida de 1 estabelecimento em cada lista coletiva. 
Determinou-se a área média na amostra e aplicou-se ao número total de 
estabelecimentos cadastrados no grupo. 
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Selegáo de áreas 


Cada distrito selecionado foi dividido no maior número possível de 
áreas perfeitamente definidas, limitadas por acidentes facilmente identifi- 
cáveis, tais como: rios, estradas de rodagem, estradas de ferro etc. Uma 
área foi entáo selecionada, dentro de cada distrito, com probabilidade pro- 
porcional á sua superfície. Para esta selecáo náo se determinou a superfície 
absoluta das áreas, usando-se um processo de contagem de pontos de cru- 
zamento em quadrículas para indicar a superfície relativa das áreas dentro 
de cada distrito. 


Subamostra 


Em virtude da subamostra, destinada a investigar a quantidade pro- 
duzida de trigo, ter sido constituída de duas partes distintas, uma formada 
por estabelecimentos da amostra do Cadastro e a outra por estabelecimentos 
levantados na amostra de áreas, usou-se processos diferentes para a sua 
selecáo, de acórdo com cada uma dessas partes. 

Parte constituida por estabelecimentos da amostra do Cadastro—Para 
cada um dos trés estratos de área cultivada com trigo nos quais conglome- 
rados foram usados (0 a 5 ha, 5 a 20 ha e 20 a 500 ha), uma subamostra 
sistemática de conglomerados foi retirada. Empregou-se uma fracáo de 
amostragem diferente para cada estrato a fim de melhorar a reparticáo 
feita na amostra do Cadastro. O estrato 4, constituído pelos estabelecimen- 
tos de 500 hectares e mais cultivados com trigo, que foram na sua totali- 
dade investigados na amostra do Cadastro, foi dividido em dois subestra- 
tos—estabelecimentos de 500 a menos de 1.000 hectares cultivados com trigo 
e estabelecimentos de 1.000 hectares e mais de trigo. Incluiu-se na suba- 
mostra todos os estabelecimentos com 1.000 hectares e mais de trigo e 
uma parcela do grupo de 500 a menos de 1.000 hectares de trigo obtida 
por intermédio de uma selecáo sistemática usando-se o intervalo 3. Foram 
portanto selecionados 299 estabelecimentos nesta parte da subamostra, 
tendo ocorrido no entanto a necessidade de cancelar da investigacáo 26 
estabelecimentos por náo cultivarem trigo em 1958, ou, em alguns casos, 
por estarem duplicados no Cadastro, desta forma constituiram efetiva- 
mente esta parte da subamostra 273 estabelecimentos. 

Parte constituida de estabelecimentos da amostra de áreas—Os estabe- 
lecimentos náo cadastrados em 1957 encontrados na amostra de áreas 
foram estratificados segundo a área cultivada com trigo em 1958. Os estra- 
tos adotados foram os seguintes: de menos de 5 ha; de 5 a menos de 20 ha 
e de 20 ha e mais. “Todos os estabelecimentos do estrato de 20 hectares e 
mais foram incluídos na subamostra. Dos estratos de menos de 5 ha e de 
5 a menos de 20 ha, selecionou-se uma amostra sistemática de 1/10 e 1/3 
respectivamente dos estabelecimentos. 
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X.  PROCESSOS DE ESTIMAGÁO 


Tódas as estimativas foram obtidas pela adicáo de trés parcelas estima- 
das separadamente: a primeira, constituida pelos estabelecimentos cadas- 
trados fornecida pela amostra do Cadastro e a segunda e terceira obtidas 
por intermédio da amostra de áreas constituidas pelos estabelecimentos 
omitidos no Cadastro e pelos novos estabelecimentos produtores. Como 
nos referimos constantemente neste trabalho a ésses trés tipos de estabele- 
cimentos é necessário que esclarepamos o seu significado: 


Estabelecimentos cadastrados: Usamos essa denominacío para os estabelecimentos 
arrolados na operacáo cadastral realizada em 1957 — o Cadastro de Trigo. De acórdo 
com o critério daquele levantamento, trata-se de estabelecimentos que cultivaram trigo 
em 1957 ou em 1956. 

Estabelecimentos omitidos no Cadastro: Referimo-nos aos estabelecimentos que 
tendo plantado trigo em 1957 ou 1956 náo foram arrolados no Cadastro. 

Estabelecimentos novos: Chamamos assim aos estabelecimentos que plantando 
trigo em 1958 náo fizeram plantacóes déste cereal mos anos de 1957 ou 1956. Sáo 
portanto novos em relacáo ac Cadastro, diferindo do grupo anterior porque náo apre- 
sentavam no ano do Cadastro as condicóes para serem arrolados. 


Os principais itens estimados foram área cultivada e producáo. Foi 
utilizado um processo de estimacáo diferente para cada um dos trés tipos 
de estabelecimentos investigados. O processo utilizado em cada caso apro- 
veitou ao máximo os “dados auxiliares” que se dispunha do Cadastro. 


Os processos adotados para área cultivada representam os trés tipos prin- 
cipais de estimativa comumente usados em levantamento por amostragem 
a estimativa de regressáo ou estimativa de diferenca, a estimativa de razáo 
e a estimativa simples sem tendenciosidade. 


Utilizou-se uma estimativa de diferenca para área cultivada dos esta- 
belecimentos do Cadastro. A diferenca existente entre a área cultivada 
com trigo em 1958 e a área correspondente em 1957 foi apurada de cada 
estrato da amostra de estabelecimentos do Cadastro; os valores da amostra 
foram entáo ponderados pelo inverso da fracáo geral de amostragem de 
cada estrato, para se obter uma estimativa simples sem tendenciosidade da 
diferenca entre a área cultivada com trigo em 1957 e 1958 para o universo 
de todos os estabelecimentos do Cadastro; éste valor foi entáo adicionado 
ao total, obtido do Cadastro, da área cultivada com trigo em 1957. Em 
outras palavras, a amostra foi usada para se fazer uma estimativa simples 
sem tendenciosidade da diferenca entre 1957 e 1958 e esta estimativa foi 
somada ao total do Cadastro para 1957. 

Foi utilizada uma estimativa de razáo para a área cultivada em esta- 
belecimentos náo cadastrados e que cultivavam trigo em 1957. A área 
cultivada com trigo em 1958 em estabelecimentos desta classe de cada 
área da amostra de áreas foi inflacionada pelo inverso da probabilidade 
de selecáo daquela área. A soma déstes valores forneceu uma estimativa 
simples sem tendenciosidade da área cultivada com trigo em 1958 em esta- 
belecimentos desta classe. Éste total foi entáo inflacionado pela razáo 
entre o total da área cultivada com trigo em 1957 pelos estabelecimentos 
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cadastrados e a estimativa simples sem tendenciosidade daquele total ba- 
seado na amostra de áreas. Um outro modo de descrever éste processo seria 
dizer-se que a amostra de áreas foi usada para fornecer uma estimativa 
da razáo entre a área de trigo cultivada em 1958 de estabelecimentos que 
plantavam trigo em 1957 mas que, no entanto, náo se achavam incluídos 
no Cadastro e a área de trigo cultivada em 1957 pelos estabelecimentos do 
Cadastro; esta foi entáo multiplicada pelo total já obtido da área de trigo 
cultivada em 1957 pelos estabelecimentos do Cadastro. 


Foi utilizada uma estimativa simples sem tendenciosidade para a área 
cultivada em estabelecimentos novos. A área cultivada com trigo em 1958 
pelos estabelecimentos novos, isto é, aquéles estabelecimentos que náo 
plantaram trigo em 1957 ou 1956, foi ponderada em cada área da amostra 
de áreas pelo inverso da probabilidade de selecáo daquela área. A soma 
déstes valores para tódas as áreas da amostra forneceu uma estimativa 
simples sem tendenciosidade da área de trigo cultivada em 1958 pelos esta- 
belecimentos novos. 


As trés estimativas independentes já descritas foram entáo somadas 
para se obter a estimativa geral, para o Estado, da área cultivada com trigo 
em 1958. 

Para a estimativa da producáo empregamos estimativas de razáo. Para 
cada um dos trés grupos de estabelecimentos—cadastrados, omitidos no 
Cadastro e novos—foram feitas estimativas simples sem tendenciosidade 
tanto da área cultivada com trigo em 1958 como da quantidade colhida 
na base dos dados dos estabelecimentos da subamostra utilizada na fase 
posterior á colheita. A razáo entre producáo estimada e área cultivada de 
cada uma das trés classes forneceu uma estimativa de rendimento, que foi 
entáo multiplicada pela estimativa correspondente de área cultivada, 
baseada na amostra completa, a fim de se obter a estimativa final da pro- 
ducáo daquela classe. A soma destas estimativas para as trés classes forneceu 
a estimativa final da producáo do Estado. 

Essencialmente os mesmos processos foram utilizados para estimar os 
outros itens que foram apurados, tais como área colhida, quantidade ven- 
dida, etc. Para os leitores interessados em detalhes técnicos dos processos 
utilizados, apresentamos a seguir as fórmulas utilizadas para a estimativa 
da área cultivada. Como foi dito anteriormente a estimativa da área culti- 
vada com trigo em 1958 foi obtida pela soma das trés parcelas: 

Xo,, — Área cultivada com trigo nos estabelecimentos cadastrados; 


ES 


> Área cultivada com trigo nos estabelecimentos novos; 


X vc, — Área cultivada com trigo nos estabelecimentos omitidos no 
NCse 
Cadastro. 


Assim, Xi = Xo a e 
» X5g Xcy + Any TH Anc, 


Essas parcelas foram obtidas da seguinte maneira: 
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a. Área cultivada com trigo em 1958 nos estabelecimentos cadas- 
trados. As diferencas observadas na amostra entre as áreas cultivadas 
com trigo em 1958 e 1957 foram ponderadas pelo inverso da fracáo 
de amostragem em cada estrato. Á soma algébrica dessas diferencas 
ponderadas, adicionou-se a área cultivada com trigo em 1957 segundo 
o Cadastro. Foi portanto uma estimativa de diferencas. 


Poderemos representar da seguinte forma: 


Lo, e. Xc,, + D 


em que 


onde 


sendo: 
índice de conglomerado 
indice de estrato 
estimativa da diferenga para o estrato i 
número de conglomerados no estrato 1. 


péso do estrato 1, K = — 


P 


1 


número de estratos 


área cultivada com trigo em 1958 no conglomerado ¡ do 


estrato 1 


área cultivada com trigo em 1957 no conglomerado ¡ do 
estrato 1 


área cultivada com trigo em 1957 no total do Estado segundo 


o Cadastro 


Área cultivada com trigo em 1958 nos estabelecimentos omiti 
dos no Cadastro. Obteve-se esta parcela calculando-se primeiro uma 
razáo entre o total da área cultivada com trigo em 1957 no Rio Grande 
do Sul fornecido pelo Cadastro e uma estimativa simples désse total 
obtida a partir dos valores apurados nas áreas de amostra, e aplican- 
do-se esta razáo a uma estimativa simples sem tendenciosidade da área 
cultivada com trigo em 1958 nos estabelecimentos omitidos no Cadastro. 
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Assim: 


em que: 


M Ci Z 
E, K; do X Ciigo 


in 1 j 4 


M mi 
”p e p 
A A AN 
t=1 j=1 


indice de estabelecimento 

índice da área selecionada no estrato 

número de estabelecimentos omitidos, na área 1 

péso da área 1 

número de estratos 

área cultivada com trigo no estabelecimento ¡ da área 1 
área cultivada com trigo em 1957 no total do Estado segundo 
o Cadastro 

estimativa da área cultivada com trigo em 1957 no total do 
Estado baseada nas áreas de amostra 

número de estabelecimentos cadastrados, na área 1 


área cultivada com trigo em 1957 pelos estabelecimentos 
cadastrados encontrados na área i 


c. Área cultivada com trigo em 1958 nos novos estabelecimentos. 
Féz-se uma estimativa simples sem tendenciosidade. Aplicou-se ao total 
de área cultivada com trigo em 1958 dos novos estabelecimentos, em 
cada área selecionada, o péso correspondente da área, isto é, o inverso 
de sua probabilidade de selecáo. 


Utilizou-se a fórmula: 
ds M ni 
o e 
¿== 1 j=1 


— índice de estabelecimento 


— índice da área selecionada no estrato 
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K; péso da área 1 
M número de estratos 


ni número de estabelecimentos novos na área i 


área cultivada com trigo em 1958 no estabelecimento j da 
área 1 


Nim 


XI. ERROS DE AMOSTRAGEM 


O plano de amostragem foi elaborado com a finalidade de fornecer 
estimativas de área cultivada com trigo e producáo, que apresentassem 
coeficientes de variacáo de aproximadamente 5%. 

Náo foi possível fazer uma previsáo exata dos erros antes da realizacáo 
do levantamento, principalmente por falta de elementos que possibilitassem 
um cálculo da precisáo da amostra de áreas. Como, no entanto, sabia-se 
previamente que os componentes das estimativas procedentes da amostra 
de áreas, isto é, área cultivada e producáo dos estabelecimentos novos e 
omitidos no Cadastro, certamente apresentariam erros relativos bem maio- 
res do que os erros relativos dos componentes fornecidos pela amostra do 
Cadastro, planejou-se a amostra do Cadastro de forma a dar um érro re- 


lativo menor do que 5%,, de modo a contrabalancar o érro mais elevado 


esperado para a amostra de áreas. 

Os cálculos de erros de amostragem já efetuados demonstram que o 
plano adotado, náo obstante a deficiéncia de elementos necessários a um 
planeamento perfeito, forneceu uma estimativa da área cultivada com 
trigo com precisáo bastante próxima do valor desejado. O erros de amos- 
tragem das estimativas de área cultivada com trigo em 1958, para os trés 
componentes e para o total geral sáo apresentados a seguir: 


Estimativa DESVIO PADRÁO 
da área DA ESTIMATIVA 
GRUPO DE ESTABELECIMENTOS cultivada 
com trigo 
em 1958 Absoluto Relativo 
(ha) (ha) | (0%,) 


Cadastrados...... 968 311 22 687 


Omitidos no Cadastro 133 086 5 211 
ÓN 127 356 305 


TOTAL... , 1 288 753 


y 
827 


Nesta tabela, o desvio padráo absoluto do total é igual á raiz quadrada 
da soma dos quadrados dos desvios padráo dos trés componentes. 
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Pretende-se, oportunamente, fazer cálculos de variáncia para producáo 
e possivelmente outros itens. Ésses dados teráo grande importáncia náo só 
na avaliacáo dos resultados déste levantamento, mas também no planeja- 
mento de amostras para inquéritos futuros. 


XII. VIAGENS 


Foram feitas duas viagens ao Rio Grande do Sul. A primeira viagem 
se féz para estudos do processo de amostragem á base de áreas que se 
pretendia empregar. Os estudos relacionaram-se principalmente com ta- 
manho de área de amostra, maneira de reconhecer os estabelecimentos já 
cadastrados encontrados nessa área e determinacáo dos novos, bem como a 
utilizacáío de mapas visando á avaliacáo de sua precisáo com o fito de 
escolher quais os acidentes geográficos e outros pontos de referéncia carto- 
gráfica que deveriam ser utilizados para a delimitacáo das áreas de amostra. 
£stes estudos se processaram no Distrito de Baráo de Triunfo, do Muni- 
cípio de Sáo Jerónimo, e no Distrito de Galópolis, em Caxias do Sul. 
A segunda viagem foi efetuada para lancamento do inquérito, destinando-se 
principalmente a proporcionar um contato dos encarregados da operacáo 
com a réde de coleta do IBGE a fim de garantir uma melhor instrucáo aos 
Agentes e também permitir estudar com a Inspetoria Regional de Esta- 
tística Municipal do Rio Grande do Sul detalhes de operacáo e o melhor 
plano para o desenvolvimento da coleta. 


XIII. InsTRUMENTOS DE COLETA 


Foram utilizados os seguintes instrumentos de coleta: questioná- 
rio T-l—destinado a coletar informacóes sóbre os estabelecimentos 
da amostra do Cadastro e sóbre os estabelecimentos produtores de trigo 
em 1958 e náo cadastrados em 1957, encontrados nas áreas de amostra; 
fólha de coleta T-2a—para registro dos estabelecimentos cadastrados em 
1957 encontrados nas áreas de amostra; fólha de coleta “T-2b—para registro 
de todos os estabelecimentos náo cadastrados em 1957 encontrados nas 
áreas de amostra quer plantassem ou náo trigo; questionário “1-3—usado 
na indagacáo aos agrónomos sóbre y rendimento esperado da safra; ques- 
tionário T-4—utilizado para coleta de dados de producáo nos estabeleci- 
mentos da subamostra. 


XIV. INSTRUCOES E TREINAMENTO PARA COLETA 


Além das instrugóes de preenchimento constantes dos questionários, 
forneceu-se aos Agentes encarregados da coleta instrucóes mimeografadas 
sóbre o mecanismo da operacáo, como: determinacáo de estabelecimentos 
novos, reconhecimento de estabelecimentos cadastrados, maneira de operar 
no levantamento da amostra de áreas, etc. 
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Além disso os autores déste relatório, em viagem que fizeram ao Rio 
Grande do Sul para lancamento do inquérito, submeteram a um pequeno 
treinamento de dois dias um grande número de Agentes Municipais dos 
principais municípios incluídos na amostra e todos os Agentes Itinerantes. 
Os Agentes Itinerantes tiveram a funcáo de transmitir aos Agentes Muni- 
cipais as instrucóes recebidas e superintender os trabalhos de coleta nas 
suas Zonas de Itineráncia. £ste treinamento constou de uma parte expo- 
sitiva dos conceitos de itens investigados, critérios adotados, mecanismo 
de trabalho e outros detalhes da operacáo e de uma segunda parte em que 
foram debatidos vários casos figurados, fazendo-se por fim uma pequena 
prova oral que revelou estarem os Agentes plenamente capacitados para 
executarem o inquérito. 


XV. FEnviO E RECEBIMENTO DO MATERIAI 


O material de coleta foi enviado á Inspetoria Regional, sendo de 
lá distribuído aos Agentes Municipais. Grande parte dos Agentes recebeu 
o material diretamente por ocasiáo do treinamento anteriormente referido, 
os restantes receberam por intermédio do Agente Itinerante. 

O material coletado foi recebido pelo órgáo central parceladamente. 
Na primeira fase do inquérito, em 6 remessas foram recebidos 97%, dos 
questionários enviados para a amostra do Cadastro e material de 29 das 
30 áreas que compunham a amostra de áreas. Na segunda fase, foram 
recebidos 97,4%, dos questionários em 5 remessas, uma 6.1 remessa que 
completaria 98,19%, dos questionários foi recebida um més depois da 
5,4 remessa, náo sendo por isso incluídos os seus questionários na apuracáio. 

Os 39%, de questionários náo recebidos da primeira das amostras refe- 
ridas, da 1.2 fase náo foram coletados por impossibilidade de localizacáo 
dos informantes e a área faltosa náo foi trabalhada por ter adoecido o 
Agente tendo sido impossível substituí-lo neste trabalho em tempo hábil. 
A primeira remessa do material da 1.2 fase foi recebida pelo Servico de 
Estatística da Producáo no dia 17 de outubro de 1958 e a última a 26 de 
novembro do mesmo ano. Na segunda fase, a primeira remessa do material 
foi recebida a 13 de marco e a quinta remessa a 13 de abril de 1959. 


XVI. CRÍTICA DAS INFORMACOES 


O material de coleta foi submetido a crítica no órgáo central segundo 
critérios previamente fixados. A crítica dos dados nos questionários “T-1 
e T-4 foi executada com a finalidade de determinar omissóes e erros de 
registro e de declaracáo a fim de substituí-los por elementos calculados com 
base nas informacóes corretas. 


Quando foi necessário calcular dados para um ou dois estabelecimentos 
de um conglomerado, os cálculos foram feitos com base nos outros esta- 
belecimentos do conglomerado. No caso de érro ou omissáo de um quesito 
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em trés ou mais estabelecimentos de um conglomerado procedeu-se ao 
cálculo partindo-se das informacóes dos outros conglomerados do mesmo 
estrato no mesmo município ou zona. 


Quase tódas as correcóes foram feitas por intermédio de razóes obtidas 
no resto do conglomerado ou nos outros conglomerados, conforme os casos 


citados acima, entre dois quesitos estreitamente correlacionados e aplicada 
a0s questionários defeituosos. 


Na amostra de áreas realizou-se além da referida crítica o exame 
dos registros de estabelecimentos nas fólhas de coleta T-2a e T-2b. Os 
lancamentos de estabelecimentos produtores de trigo em 1958, feitos nas 
fólhas de coleta “T-2b, foram comparados com os questionários coletados 
no Cadastro de Trigo em 1957 no Distrito de localizacáo das áreas de 
amostra, com a finalidade de se verificar se haviam sido registrados, como 
novos, estabelecimentos já cadastrados na referida operacáio. Por efeito 
desta crítica algums questionários tiveram que ser devolvidos aos muni- 
cípios para esclarecimentos. 


XVII. APURACAÁO E DIVULGACAO DE RESULTADOS 


Féz-se uma apuracáo preliminar (manual) da área cultivada quando 
se dispunha apenas de uma parte dos questionários. Uma apuracáo pre- 
liminar, nas mesmas condicóes, também foi feita para a quantidade pro- 
duzida. Apuracóes finais foram feitas, também manualmente, para os 
itens: área cultivada, área colhida, quantidade produzida, quantidade ven- 
dida, variedades, época de plantio, etc. 

Estáo em elaboracáo apuraqóes mecánicas segundo classificacóes, que 
serviráo de base a estimativas mais detalhadas. Os principais dados obtidos 
nessas apuracóes foram sendo divulgados pelo Servico de Estatística da 
Producáo á medida que iam ficando disponíveis. Dessa maneira os dados 
oficiais do citado Servico sóbre área cultivada com trigo em 1958 no Rio 
Grande do Sul, divulgados no Anuário Estatístico do Brasil do IBGE 
como provisórios, foram os resultados da apuracáo preliminar déste inqué- 
rito. Aproveitamos a oportunidade déste relatório para dar divulgacáo a 
alguns outros resultados, em quadros na parte “Anexos.” A apresentacáo 
completa e detalhada dos resultados obtidos será feita por intermédio de 
uma publicacáo especial que o Servico de Estatística da Producáo pretende 
divulgar próximamente. 


XVIMN. COLABORADORES 


O entusiasmo de grande número de pessoas garantiu o éxito déste trabalho. 
Agradecemos a todos e ma impossibilidade de uma citaciío completa, destacamos Os 
nomes de alguns: O Dr. Paulo Rangel, grande entusiasta da amostragem que, na 
diregáo do Servigo de Estatística da Producáo, náo mede esforgos para implantar novas 
técnicas de levantamentos. O Inspetor Regional de Estatística Municipal do Rio 
Grande do Sul, Sr. Enio Moura, e seu assistente, Sr. Kermit Velasquez, que nos 
prestaram valiosa colaboracáo estabelecendo conosco detalhes da apuracío e nos acom- 
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panhando nas viagens que empreendemos pelo interior daquele Estado. O S1 
Nery que superintendeu os trabalhos de crítica 
cipado de tódas as fases do inquérito. O Dr 


Luís 
e apuracio das amostras, tendo parti- 


Espiridiáo Faissol, do Conselho Nacional 
de Geografia, e o Dr. Osinan Velazquez, do Departamento de Geografia do Rio Grande 


do Sul, que nos forneceram os mapas municipais utilizados na amostra de áreas. A 
Divisio de Águas do Departamento Nacional de Producío Mineral que além de nos 
auxiliar no cálculo planimétrico da superfície dos distritos nos mapas municipais, nos 
forneceu todos os dados sóbre precipitacóes pluviométricas no Rio Grande do Sul, 


de zonas fisiográficas para constituicáo 
seis grandes zonas para as quais fizemos as apuracóes dos dados. O Di 


necessários ao estudo sóbre agrupamento das 


José da Costa 
Sacco, do Instituto Agronómico do Sul, que prestou valiosa colaboracáo fazendo, sóbre 
uma lista de apuracáo preliminar de variedades, 2 
outros elementos para a crítica do assunto 

a que tivemos oportunidade de nos dirigí 


de trabalho e 


reducáo de sinónimos e indicando 
Fodos os agrónomos do Rio Grande do Sul, 

que nos auxiliaram nos seus municípios 
nos prestaram informacóes através do questionário sóbre previsio da 
safra de 1958, Os Prefeitos e Subprefeitos dos municípios 


1 


da amostra que prestaram 


auxílio á operacáo sóbre várias formas, inclusive em muitos casos propiciando conducáo 


aos Agentes Municipais 


Os Agentes Itinerantes e os Agentes Mun 1 


cipais de FEstatística a cuja dedicacáo € 
espírito de sacrifício devemos a principal parcela do éxito déste trabalho 
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INQUÉRITO SÓBRE OS ESTABELECIMENTOS PRODUTORES DE TRIGO — 1958 


Para uso 
Questionário Geral — Modélo T-1 da 
repartigáo 
ñ 5 Ó apuradora 
(Leia atentamente as instrucoes no verso, antes de preencher) 


Código | C 


Unidade da Federagáo...- Distrito | 
| 


Município........... e - Subdistrito_ 


Localizagáo do estabelecimento. . 


A — DADOS GERAIS DO ESTABELECIMENTO 


1 — Nome do estabelecimento 
— Nome do agricultor . 
- Condigáo do agricultor: 
Proprietário E Parceiro 
Arrendatário ] Ocupante 
- O estabelecimento é dirigido diretamente pelo Agricultor ou por Administrador ? 
Agricultor 
Administrador 
5 — Área total do estabelecimento hectares 


ATIVIDADE PRINCIPAL DO ESTABELECIMENTO 
6 — Qual a atividade principal do estabelecimento ? 


PP 


Agricultura O Agropecuária ] E 
Pecuária....... O O 
- No caso da atividade principal do estabelecimento ser Agricultura ou Agropecuária, qual a 
principal cultura ? 
Trigo y Mandioca 
Milho 
SAFRA DE 1958 


e 
8 — Area cultivada com trigo em 1958 hectares 


9 — Variedades cultivadas: E : 
Nome da variedade Area cultivada Epoca do plantio 





(Indique a quinzena e o més) 


D — SAFRA DE 1957 
10 — Área cultivada com trigo em 1957 : hectares 
11 — Quantidade de trigo colhida em 1957 sacos de 60 kg 


12 — Dototal do trigo colhido em 1957, qual a quantidade vendida ? ; ---sacos de 60 kg 


Assinatura do entrevistador Assinatura do responsável 
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DA SAFRA DF 


Trio 


INSTRUCOES PARA O PREENCHIMENTO 


Localizacáo do estabelecimento Deseja-se obter 
indicacóes sóbre a localizagáo as mais precisas 
quanto possível. Indique náo apenas a localidade 
onde se situa o estabelecimento, como por 
exemplo, “linha”” ou “travessáo”, mas dé tam- 
bém informacóes em relagáo á estrada 
próxima ou outro ponto de referéncia. 


mais 


A — DADOS GERAIS DO ESTABELECIMENTO 


1 — Nome do estabelecimento — Éste quesito 
se destina á mais ampla identificagáo do esta- 
belecimento; procure pois obter informagóes 
completas a respeito. 


2 — Nome do Agricultor — Deve ser registrado 
neste quesito o nome completo da pessoa que 
explora o estabelecimento. Se o mesmo estiver 
entregue a um administrador, náo deve ser 
registrado o seu nome e sim o de quem ex- 
plora o estabelecimento, seja ma qualidade de 
proprietário, arrendatário, parceiro ou ocupante. 


3 — Condicáo do Agricultor — Assinalar com 
um X o quadrado que corresponde «a condigáo 
do Agricultor: 


Proprietário Quando o Agricultor fór o dono 
das terras em que se localiza o estabelecimento. 
Arrendatário Quando o Agricultor pagar uma 
quantia fixa pelo uso da terra. Geralmente o 
arrendamento é pago em dinheiro e o contrato 
é feito por um pfazo determinado, um ano, 
dois anos, etc. Parceiro — Quando o Agricultor 
trabalhar em terras de outros pagando com uma 
parte proporcional da  colheita, metade, uma 
terca parte, etc. Ocupante Quando o Agri- 
cultor náo fór o dono das terras em que traba- 
Ilha, nem pagar em dinheiro ou com parte da 
colheita para usá-las. A ocupacáo das terras 
pode ser feita com ou sem o consentimento do 
proprietário 


Nos casos em que o agricultor tiver mais 
de uma das condicóes indicadas acima, assinalar 
a que corresponda á maior área, exceto quando 
uma das condicóes fór a de proprietário que 
prevalecerá, mesmo  correspondendo á menor 
área. 


4 — O estabelecimento é dirigido diretamente 
pelo Agricultor ou por um administrador? — 
Deseja-se saber se o estabelecimento é dirigido 
pelo próprio Agricultor que o explora ou se a 
direcáo está entregue a um administrador. Náo 
deve ser considerado administrador o simples 
empregado que toma conta do estabelecimento, 
na auséncia eventual do Agricultor 


5 — Área total do estabelecimento — Registre 
a área do estabelecimento em hectares. Se o 
Agricultor informar a área em outra unidade de 
superfície, registre no questionário essa área, 
riscando a palavra hectares e indicando o nome 
e a equivaléncia da unidade 


B -— ATIVIDADE PRINCIPAL DO ESTABELE- 
CIMENTO 


6 — Qual a atividade do estabelecimento? — 
No caso do estabelecimento se dedicar principal- 
mente á lavoura, assinale “Agricultura”. Se a 
criacáo de animais (bovinos, equinos, asininos, 
muares, suínos, ovinos ou caprinos) fór mais 
importante para oO  estabelecimento,  assinale 


“Pecuária”. No caso de terem mais ou menos 
a mesma importáncia para o estabelecimento a 
criagáo de animais e a plantacáo, assinale “Agro- 
pecuária”. Quando o estabelecimento se dedicar 
principalmente a alguma outra atividade, escreva 
na linha pontilhada o nome dessa atividade e 
assinale o quadrado respectivo. 


7 — No caso de a atividade principal do estabe- 
lecimento ser Agricultura ou Agropecuária, qual 
a principal cultura? Éste quesito é uma com- 
plementacáo do anterior, para os casos em que 
a atividade principal do estabelecimento fór 
Agricultura ou Agropecuária 


Se a principal cultura fór diferente das que 
estáo indicadas no questionário, escreva o nome 
dessa cultura ma linha pontilhada e assinale o 
quadrado correspondente 


C — SAFRA DE 1958 


8 — Área cultivada com trigo em 
Registre aqui o total da 
trigo Éste quesito deve corresponde á soma 
das áreas declaradas no quesito seguinte. Se, 
por qualquer motivo, no momento de preencher 
o questionário, existir no estabelecimento algu- 
ma área que ainda vá ser semeada éste ano 
com trigo, deve ser somada esta área com a já 
semeada, a fim de se obter o total da área 
de trigo para 1958. No caso de náo ser possível 
ao responsável estimar a área em hectares, a 
informagáo deve ser obtida na unidade de su- 
perfície de seu conhecimento, procedendo-se da 
forma indicada no quesito 5. 


1958 — 
área cultivada com 


9 — Variedades cultivadas — Deseja-se obter 
as informacóes de cultivo de trigo separada- 
mente por variedade cultivada. Assim, anote 
nas linhas pontilhadas o nome da variedade 
(Frontana, Trintani, Bagé, etc.), a área com 
ela cultivada e a época em que foi feito o 
seu plantio 

A época do plantio deverá ser 
acórdo com a quinzena e o 
exemplo: 1.2% quinzena de 
zena de junho, etc. 


indicada de 
més, como por 
julho, ou 2.2 quin- 


D — SAFRA DE 1957 


10 — Área cultivada com trigo em 1957 — 
Deve ser registrada tóda a área que tenha 
sido plantada com trigo em 1957, mesmo que 
em parte dessa área náo tenha havido colheita. 

No caso de náo ser possível ao responsável 
estimar a área em hectares, proceda da mesma 
forma indicada no quesito 5. 


11 — Quantidade de trigo colhida em 1957. 


12 — Do total do trigo colhido em 1957 qual 
a quantidade vendida? — Os registros devem ser 
feitos em sacos de 60 kg. Quando a informacáo 
obtida fór em sacos de outro tamanho ou em ou- 
tra unidade, registre a quantidade, risque as pa- 
lavras sacos de 60 kg e escreva o nome da uni- 
dade e a equivaléncia em quilos dessa unidade. 


Exemplo: 


100 sacos de 50 kg 
800 toneladas 
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LEVANTAMENTO POR AÁMOSTRAGEM DA SAFRA DE TL riGO 827 
INQUÉRITO SOBRE OS ESTABELECIMENTOS PRODUTORES 
DE TRIGO — 1958 
QUESTIONARIO ESPECIAL — MODÉLO T-3 


Municipio: 


1 — Rendimento esperado de trigo por hectare na safra de 1958 
a) Rendimento médio do município: quilos por hectare 
b) Rendimento no município das principais variedades: 
Nome da variedade Produgáo por hectare 
' 
quiios 
, 
quilos 


quilos 


2 — Rendimento de trigo por hectare verificado na safra de 1957: 


quilos por hectare 


Quais as causas da diferenga de rendimento entre a safra do ano passado e a atual safra de trigo? (pragas, 


geadas, doencas, etc.) 


4 — Observagdes: 


Data: 
Engenheiro Agrónomo 


NOTA Éste questionário deverá ser devolvido ao Agente Municipal de Estatística que o reme- 
terá, imediatamente, ao SEP. A sua devolugáo, no mais breve espago de tempo possível, é de suma impor- 
táncia para o conhecimento da safra tritícola nacional. 
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INQUÉRITO SOBRE OS ESTABELECIMENTOS PRODUTORES 
DE TRIGO — 1958 


QUESTIONARIO ESPECIAL — MODÉ£LO T-4 


Unidade da Federagáo Distrito 
Município. ... -- y Subdistrito 


Localizagáo do estabelecimento 


A — DADOS GERAIS DO ESTABELECIMENTO 

1 — Nome do estabelecimento 

2 — Nome do agricultor 
3 — Condigáo do agricultor 
4 — Área total do estabelecimento 
SAFRA DE 198 DO ESTABELECIMENTO 

- Área cultivada com trigo na safra de 1958 ] ha 

) — Dototal da área cultivada com trigo na safra de 1958, qual a área colhida ? ha 


7 — Quantidade de trigo colhido na safra de 1958 sacos de 60 kg 


8 — Do total de trigo colhido na safra de 1958, qual a quantidade vendida ou a ser vendida ? 
sacos de 60 kg 


9 — Variedades cultivadas na safra de 1958: 

a) Nome da variedade  b) Área cultivada  c) Área colhida d) Quantidade colhida 
ha ha Sacos de 60 kg 
ha ha sacos de 60 kg 
ha ha sacos de 60 kg 


sacos de 60 kg 


Observagdes: - 


Assinatura do entrevistador 





LEvANTAMENTO POR AMOSTRAGEM DA SAFRA DE TRIGO 829 


INQUÉRITO SÓBRE OS ESTABELECIMENTOS PRODUTORES 
DE TRIGO — 1958 


Primeira fase 
INSTRUGÓES DE OPERAGAO 


£ste levantamento estatístico destina-se a investigar, pelo processo de amostragem, 
a cultura de trigo na safra de 1958 no Rio Grande do Sul. 

A operacío será executada em duas fases: a primeira visando obter informacóes 
sóbre a área cultivada e outros dados relativos ao plantio de trigo e a segunda, a 
quantidade produzida de trigo na atual safra. 

A primeira fase do levantamento se compóe de duas amostras independentes: 
amostra de estabelecimentos cadastrados em 1957 e amostra de áreas em que seráo 
obtidos dados sóbre os estabelecimentos náo cadastrados em 1957. 

Para execucáo do trabalho desta primeira fase, os Agentes Municipais receberáo: 
questionários T-1, com dados de identificacio transcritos do cadastro de trigo de 1957 
para determinados estabelecimentos: questionários T'-1, em branco; fólhas de coleta 
T-2A e T-2B; e mapas municipais com uma área assinalada. 

O emprégo déste material será o seguinte: questionários T-1 com os dados de 
localizacáo e identificacáo transcritos do cadastro de trigo de 1957 — para preenchi- 
mento nos estabelecimentos néles indicados; questionários T-1 em branco — para preen- 
chimento nos estabelecimentos náo cadastrados em 1957 que plantem trigo em 1958, 
encontrados nas áreas de amostra; fólha de coleta T-2A — para registro dos estabeleci- 
mentos cadastrados em 1957 localizados nas áreas de amostra; fólha de coleta T-2B 
para anotacáo de todos os estabelecimentos náo cadastrados em 1957 
áreas de amostra, quer plantem ou náo trigo em 1958. 


encontrados nas 


Passaremos a descrever as amostras citadas, fazendo algumas recomendacóes quanto 
ao trabalho que deveráo executar os Agentes. 


AMOSTRA DOS ESTABELECIMENTOS CADASTRADOS EM 1957. Esta parte 
será feita em 64 municípios do Estado. O número de estabelecimentos a investigar, 


em cada municipio, será variável, sendo no entanto, em média, de 30. Os estabelecimen- 
tos foram escolhidos formando, geralmente, grupos de 


5 estabelecimentos próximos, 
dentro da mesma localidade (éstes grupos sáo chamados de conglomerados); além déstes, 
estáo incluídos na amostra todos os grandes estabelecimentos produtores de trigo com 
500 ou mais hectares dessa cultura. 

O Agente Municipal receberá os questionários com as partes de localizacáo e 
identificacáo dos estabelecimentos já preenchidas, devendo procurar os estabelecimentos 
indicados, a fim de obter os dados solicitados. 

É importante que o preenchimento se faca para exatamente os mesmos estabele- 
cimentos que foram cadastrados e escolhidos para a amostra. Assim, em vista de 
ocorrer freqiientemente que um mesmo Agricultor possua mais de um estabelecimento 
no município, deve o agente certificar-se de que o estabelecimento sóbre o qual está 
pedindo as informacóes é o mesmo cujo questionário foi enviado. Para isto dispóe das 
informacóes transcritas sóbre localizacáo e identificacáo (como nome do estabelecimento 
e, principalmente, a área total). 

Quando um estabelecimento da amostra tiver vendido ou estiver sendo explorado 
por outra pessoa, por parceria, arrendamento, etc., será preenchido o questionário 
enviado, emendando-se a parte referente ao Agricultor. Note-se que é importante que 
seja preenchido o questionário do estabelecimento que foi cadastrado, náo importando 
que esteja sendo explorado por outra pessoa. 

No caso em que um estabelecimento da amostra tiver sido dividido em dois ou 
mais estabelecimentos, o Agente preencherá o questionário que lhe foi enviado, ano- 
tando a ocorréncia e preenchendo outros questionários para os estabelecimentos origi- 
nados. Para ésse efeito sáo enviados alguns questionários em branco. 

Com a finalidade de diminuir o trabalho da segunda fase do levantamento, a ser 
realizada em janeiro de 1959, o Agente Municipal deve solicitar ao Agricultor que, 
ao passar pela sede do Municipio depois de ter realizado a colheita, procure a Agéncia 
Municipal, a fim de fornecer informacóes sóbre a quantidade obtida de trigo. 
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Quando o Agente Municipal encontrar o Agricultor responsável por estabeleci- 
mento da amostra na própria sede do Município ou em alguma Vila, náo precisará 
se deslocar até o estabelecimento, podendo obter as informacóes ali mesmo. 

AMOSTRA DE ÁREAS. 


Esta amostra será feita em apenas 29 municípios do 
Estado. 


Nesses municipios seráo preenchidos questionários para os estabelecimentos loca- 
lizados em uma determinada área de um Distrito. 

Os Agentes de Estatística dos Municipios selecionados receberáo um mapa, onde 
estará marcada com lápis azul a área em que deverá ser realizada a operacío e que 
terá a indicacáo: “Área de Amostra.'” Será enviada, juntamente com o mapa, uma 
descricío dos limites dessa “Área de Amostra” que constituirá o setor de coleta para 
o levantamento. 

O Agente verificará, de iníciv, se as delimitacóes da “Área de Amostra'” estáo 
corretas. Em caso de érro, fará as necessárias retificacóes no próprio mapa. 

Se neste exame prévio ou mesmo durante a operacáo de coleta, verificar que 
os limites indicados no mapa náo fecham um setor de coleta, deverá adotar um limite 
fácil de identificar — estradas, rios etc. — para estabelecer o fechamento do setor 
e após assinalar no mapa a correcáo, fará detalhadas observacóes no relatório. 

Além dos mapas e das descricóes das “Áreas de Amostra'” os Agentes receberáo 
questionários (fichas e listas coletivas) preenchidos durante o Cadastro de Trigo de 
1957 para o Distrito selecionado do Município, questionários “T-1 em branco e fólhas 
de coleta T-2A e T-2B em branco. 

A utilizacáo déste material deverá ser a seguinte: 

Inicialmente o Agente fará, com o auxílio de pessoas conhecedoras do local, a 
separacáo, dentre aquéles do Cadastro de 1957 do Distrito escolhido, dos questionários 
pertencentes a estabelecimentos localizados na “Área de Amostra.” 

Depois de separado o grupo de questionários (fichas cadastrais e listas coletivas) 
dos estabelecimentos que éle julga estarem localizados na área demarcada no mapa, 
o Agente terá que preencher a Fólha de Coleta T-2A (para os estabelecimentos cadas- 


trados em 1957), transcrevendo os dados désses questionários sóbre localizacáo, nome 
do agricultor e área total. Nos casos em que náo haja indicacío da área total (como 
por exemplo quando o estabelecimento tiver sido cadastrado por intermédio das listas 
coletivas) o Agente transcreverá os dados disponíveis e quando encontrar o estabeleci- 


mento na “Área de Amostra” indagará sóbre a área total, completando assim as 
informacóes. 


De posse das Fólhas de Coleta T-2A parcialmente preenchidas, e levando as 
Fólhas de Coleta T-2B e os Questionários T-1 em branco, o Agente se deslocará para 
a área assinalada no mapa a fim de dar início aos trabalhos de coleta, tendo em mente 
que todos os estabelecimentos encontrados na “Área de Amostra'' devem ser registrados 
nas Fólhas de Coleta T-2A e T-2B. 

Os estabelecimentos que tenham a sua sede localizada dentro da “Área de Amostra,” 
mas possuam parte de sua área fora, devem ser considerados como se estivessem intei- 
ramente dentro da mesma. Só náo devem ser registrados aquéles que tenham sua sede 
localizada fora da “Área de Amostra,'” embora parte déles esteja incluída. 

A forma de trabalhar será a seguinte: 


Ao obter as informacóes de um estabelecimento, o Agente deverá verificar pri- 
meiramente se ésse estabelecimento foi cadastrado em 1957; isto será conseguido, com- 
parando as informacóes sóbre localizacáo, mome do agricultor e área total, com os 
registros da Fólha de Coleta T-2A. 

A fim de diminuir o trabalho de procura ma Fólha de Coleta T-2A, o Agente 
perguntará ao Agricultor se foi cultivado trigo em 1957 ou 1956 no estabelecimento. 
No caso de resposta negativa náo haverá necessidade de procurar na Fólha de Coleta 
para verificar se existem registros do estabelecimento porque éle náo deve ter sido 
cadastrado e o Agente poderá preencher, imediatamente, a fólha de Coleta T-2B. 

No caso do informante responder que houve cultivo nos referidos anos, o Agente 
verificará se o estabelecimento está registrado ma Fólha de Coleta T-2A. No caso de 
encoutrar a linha com os registros do estabelecimento, perguntará sóbre a área cultivada 
com trigo em 1958, registrando a resposta na coluna (e) dessa linha e anotando “sim” 
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na coluna (f) em que se pergunta se o estabelecimento foi encontrado na “Área de 
mostra.” Quando náo houver registro da área total deve ser pedido também éste dado 


Alguns dos estabelecimentos registrados no T-2A também podem fazer parte da 
amostra do cadastro. Sáo fácilmente identificados pela nota présa na ficha ou lista do 
cadastro, com a seguinte redacáo: 


“Atencáio: 


Para éste estabelecimento existe um questionário T-1 da amostra do cadastro 
a preencher.”” 


Para €sses estabelecimentos existem questionários “T-1 com os dados de identificacio 
já anotados. Ao deslocar-se o Agente para a “Área de Amostra”” deve levar ésses ques- 
tionários e preenché-los ao mesmo tempo que completa o registro no T-2A, 

No caso de um estabelecimento ter cultivado trigo em 1956 ou 1957 e náo constar 
da Fólha de Coleta T-2A, o Agente informar-se-á se a pessoa que atualmente explora 
o estabelecimento é a mesma que o dirigia na época do Cadastro. Verificando que 
se irata de um mesmo estabelecimento já registrado na Fólha de Coleta T-2A em nome 


de um outro Agricultor, deverá fazer a retificacio ma Fólha de Coleta e completar 
o seu preenchimento. 


Fodos os estabelecimentos náo encontrados nas Fólhas de Coleta T-2A seráo 
registrados na Fólha de Coleta T-2B. 


Para os estabelecimentos registrados na Fólha de Coleta T-2B que cultivem trigo 
em 1958, terá que ser preenchido também um questionário “1-1, cujo número será 
inscrito na coluna (f) daquela Fólha de Coleta. 


INQUÉRITO SOBRE OS ESTABELECIMENTOS PRODUTORES 
DE TRIGO — 1958 


Segunda fase 


ÍINSTRUCOES PARA O PREENCHIMENTO DO QUESTIONÁRIO “T-4 


£ste levantamento estatístico destina-se a obter por amostragem a producáo da 
safra de trigo de 1958 no Rio Grande do Sul. Constitui a última fase do “Inquérito 
sóbre os estabelecimentos produtores de trigo em 1958.” 


A operacáo será executada por intermédio de uma amostra menor do que a 
empregada na primeira fase do inquérito, realizada em setembro de 1958 


Podos os estabelecimentos que compóem esta amostra já foram visitados na fase 


já executada do inquérito, o que de alguma forma facilita a obtencáo das informacóes 
agora solicitadas. 


Estabelecimentos incluidos no inquérito. Deveráo ser preenchidos questionários 
apenas para os estabelecimentos previamente escolhidos. A indicacío désses estabeleci- 
mentos é feita nos próprios questionários enviados ao Agente Municipal. 


É absolutamente necessário que os dados coletados se refiram rigorosamente aos 
estabelecimentos indicados nos formulários. 


Material de coleta. O Agente Municipal receberá questionários, modélo T-4, com 
alguns quesitos preenchidos com dados obtidos na primeira fase do inquérito. Esta 
transcricáo foi feita a fim de caracterizar perfeitamente o estabelecimento sóbre o qual 
se deseja obter os dados de producáo de trigo. 


Alguns dos Agentes receberáo também o mapa do município, que foi utilizado 
na primeira fase do inauérito, na amostra de área para servir de elemento auxiliar 
na localizacío dos estabelecimentos encontrados maquela área. £stes estabelecimentos 
poderáo ser identificados pela nota no rodapé do questionário: Estabelecimento da 


área de amostra. O mapa deverá ser devolvido acompanhando os questionários 
preenchidos. 
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Juntamente com os questionários seráo enviados pedidos de esclarecimentos para 
alguns estabelecimentos. Éstes esclarecimentos deveráo ser prestados o mais rápida- 
mente possível. 

Preenchimento do questionário. O Agente deverá se certificar com os Agricultores 
se os dados transcritos estáo corretos e se pertencem ao estabelecimento escolhido. Só- 
mente após isto, solicitará as informacóes necessárias ao preenchimento dos quesitos 
6, 7,8 e as partes c) e d) do quesito 9. 

No caso de ser constatado um érro nos quesitos preenchidos com dados da primeira 
fase do ¿nquérito, o Agente deverá riscar o registro errado escrevendo acima déle a 
nova informacáío e anotando em “Observacóes”” as razóes da divergéncia. 

A seguir sáo dados alguns esclarecimentos sóbre itens do questionário: 

Numeracáo e Codificacáo. No canto superior direito se encontram duas séries 
de números. A série superior refere-se á codificacío do questionário, necessária apenas 
aos trabalhos de apuracio. A inferior é o número de ordem do questionário, nesta 
amostra, dentro do município, podendo servir ao Agente para contróle de seu trabalho. 


Loca!lizagáo e identificacáo do estabelecimento. Estes quesitos foram preenchidos 
com dados obtidos na primeira fase do inquérito, a fim de possibilitar ao Agente 


Municipal, o reconhecimento perfeito do estabelecimento sóbre o qual se deseja os 
dados de producáo. 


Área cultivada com trigo em 1958. Éste quesito refere-se a tóda a área plantada 
com trigo na safra de 1958 no estabelecimento. 

Do total da área cultivada com trigo em 1958 qual a área colhida? Neste quesito 
deverá ser registrada sómente a parte da área plantada com trigo que tenha sido 
colhida. Assim se um estabelecimento semeou 80 "iectares de trigo, mas por qualquer 
motivo (doencas, pragas, inundacóes etc.) só colhe 70 hectares, o registro neste quesito 
deverá ser de 70 hectares, registrando-se no quesitc anterior 80 hectares. 

Quantidade de trigo colhido em 1958. Registrar o total de trigo que tenha sido 
obtido na área declarada no quesito 6. 


Do total de trigo colhido em 1958 qual a quantidade vendida? No caso em que 
o Agricultor ainda náo tenha vendido o seu trigo, deverá fazer uma estimativa da 
quantidade que ainda pretenda vender. Náo sáo contados neste quesito o trigo que o 
Agricultor pretenda reservar para seu próprio consumo e para plantio da próxima safra. 


Variedades cultivadas. Pede-se neste quesito a separacáo por variedades de trigo, 
das informacóes que aparecem totalizadas nos quesitos 6 e 7. 
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Zona 
Zona 
Zona 
Zona 
Zona 
Zona 


ESTADO DO RIO GRANDE DO SUL 


Agrupamento de Zonas Fisiográficas para fins de Tabulacío 


Alto Uruguai (7) 

Campos de Cima da Serra e Planalto Médio (8 e 9) 

Missóes e Campanha (3 e 4) 

Encosta Inferior do Nordeste e Encosta Superior do Nordeste 


Litoral, Depressio Central e Encosta do Sudeste (1, 2 e 6) 
Serra do Sudeste (5) 


(10 


e 


11) 
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ÁREA CULTIVADA COM TRIGO, PRODUCAO E RENDIMENTO MÉDIO, 


SEGUNDO AS ZONAS FISIOGRÁFICAS — 


ZONAS FISIOGRÁFICAS 


Alto Uruguai 

Campos de Cima da Serra e Planalto Médio 
Missdes e Campanha 

Encosta Inferior do NE e Encosta Superior do NE 
Litoral, Depressáo Central e Encosta do Sudeste 


Serras do Sudeste 


ESTADO 


Área 
cultivada 
com trigo 

(ha 


209 473 
056 

2 044 
395 
3.800 

8 985 


753 


1958 


Produgáo 
(t) 


83 251 
118 813 
80 605 
30 391 
59.606 
34 642 


407.308 


Rendimento 


médio 


(kg/ha) 


397 
299 
320 


375 
291 


331 


NOTA: Os dados foram obtidos por amoztragem sóbre os estabalecimentos produtores de trigo. O total da área culti- 


vada com trigo para o Estado apresenta um coeficiente de variagio de 5%. 
£ 


ÁREA CULTIVADA COM 


ÉPOCA DE 
PLANTIO 


SEGUNDO A ÉPOCA DE PLANTIO — 1958 


ÁREA CULTIVADA COM TRIGO EM 1958 (ha 


Zonas Fisiográficos 


Maio 
Primeira 
Segunda 


Junho 
Primeira 
Segunda 


Julho 
Primeira 
Segunda 


Agósto 
Primeira 
Segunda 


Sem declaracáo 


TOTAL 


quinzena 
quinzena 


quinzena 
quinzena 


quinzena 
quinzen: 


quinzena 
quinzena 


Campos de 
Cima da 
Sorra e 
Planalto 

Médio | 


30.486 
143 453 


93 
30 


30 | 


| 


13.216 10 


379 056 | 252 


Missdes « 
Campanha 


Nordeste 


31.008 
25 642 


3.551 


365 | 


13.353 
110.395 


Encostas do 


Litoral, 
Depressáo 
Central e 
Encosta do 
Sudeste 


| 783 


“| 416 | 


| 32.250 


| 158 800 


5.656 | 


FRIGO, DISCRIMINADA POR ZONAS FISIOGRÁFICAS, 


Serras do 
Sudeste 


118.985 


NOTA: 


Os dados foram obtidos por amostragem sóbre os estabelecimentos produtores de trigo. O total da área cul- 
tivada com trigo para o Estado apresenta um coeficiente de variacio de 5%. 





LEVANTAMENTO 


POR AMOSTRAGEM DA SAFRA DI 


rico 


ÁREA CULTIVADA COM TRIGO, DISCRIMINADA POR ZONAS FISIOGRÁFICAS 


VARIEDADES 


Bagé 
Frontana 
Prelúdio 
Lajeadin! 

T rapeano 
Colotana 
Trintani 
Lavras 
Carázinho 
Trinta e Cinco 
Fulvo 
Camacránia 
Fortaleza 
Rio Nezro 
Pelotas 
Chumbinho 
Outras 


TOTAL.. 


SEGUNDO AS VARIEDADES 


1958 


AREA CULTIVADA. COM TRIGO 1 


Zonas Fisiogr 


Campos de 


Cima da 
Serra 
Planalto 


Nédio 


15.304 
130.005 


19.615 


561 


5 099 


252 


Fr 
rn 


Central « 


Encosta do 


A A A AA A A A A A A A A 


NOTA: Os dados foram obtidos por amostragem sóbre os estabelecimentos produtores de trigo. O total da área cul- 
tivada com trigo para o Estado apresenta um coeficiente de variacáo de 5%. 
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LEGAL PROVISIONS — DISPOSICIONES LEGALES 


Ecuador: Creación de un Sistema de Coordinación para el 
Desarrollo de las Estadísticas Vitales entre los Ministerios 
de Gobierno, Economía y Defensa Nacional* 


Decreto No. 1.680, Quito, 7 de octubre de 1959 


CAMILO PONCE ENRIQUEZ, Presidente Constitucional de la República 
CONSIDERANDO: 


QUE el Registro Civil constituye la base fundamental de la organización jurídica 
de la familia ecuatoriana v es la fuente de los más importantes datos estadísticos; 


QUE todo plan de acción para el mejcramiento de las condiciones de vida de 
la familia ecuatoriana, debe basarse en la información estadística completa v científica 
mente elaborada; 


QUE la Dirección General de Registro Civil, la Dirección General de Estadística 
y Censos y la Dirección de Tabulación del Ministerio de Defensa, necesitan confeccionar 
un Índice Alfabético Nacional de todos los hechos vitales y legales, índice que prestaría 
enormes servicios a los tres Departamentos y a un sinnúmero de Instituciones Públicas 
y Privadas; 


QUE para elaborar el Indice Alfabético Nacional es indispensable establecer una 
coordinación entre los Departamentos citados, a fin de que se planifique, dirija 
efectúe esta labor conjunta con criterio técnico y medios adecuados de acción; 


OUE el Consejo Técnico de Estadística y Censos, Organismo Máximo del sistema 
estadístico nacional, luego de detenido estudio, dió su aprobación sobre los procedimientos 
técnicos que se aplicarán a la coordinación. 


DECRETA: 


Artículo 1 Decláranse como Órganos Coordinados para la confección del Índice 
Alfabético Nacional a los Ministerios de Gobierno, Economía y Defensa Nacional, por 
intermedio de la Dirección General de Registro Civil, Dirección General de Estadística 
y Censos y Dirección de Tabulación, respectivamente. 

Artículo 2. La Coordinación se llevará a efecto mediante un Organismo Coor- 
dinador Permanente, integrado por los señores Directores de los Departamentos citados 
en el artículo anterior. 

Artículo 3. Los Ministerios de Gobierno, Economía y Defensa, quedan autorizados 
para aportar por el tiempo que dure la coordinación, los elementos necesarios aplicando 
los gastos a las partidas que determinen. 

Artículo 4. Ordénase levantar un Indice Alfabético Nacional y Seccional y otras 
estadísticas, con los datos que suministre la Dirección General de Registro Civil, dichos 
trabajos se efectuarán por etapas en la forma como lo planifique el Organismo 
Coordinador. 

Artículo 5. El Organismo Coordinador, planificará, coordinará y elaborará el 
Indice Alfabético Nacional y los demás datos estadísticos que fueren necesarios. 

Artículo 6. El Orgamismo Coordinador sesionará una vez por mes en forma 
regular y extraordinariamente cuando el Presidente lo estime necesario. 

Artículo 7. El Organismo Coordinador tendrá los siguientes deberes y atribuciones: 

a. FElaborará y someterá a la aprobación del Consejo Técnico de Estadística y 
Censos, los planes de trabajo, su forma de desarrollo y el sistema de presentación de 
los datos elaborados. 


* 


Fuente: Dirección General de Estadística y Censos, Quito, Ecuador 
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b. Actuará como Organismo Supervisor de las labores que se ejecuten para llevar 
a efecto la coordinación de que trata este Decreto. 


Cc. Estudiará y propondrá a los diferentes Ministerios Miembros, por intermedio 
del Consejo Técnico de Estadística y Censos, las medidas técnicas y administrativas 
necesarias y adecuadas para perfeccionar la coordinación. 

d. Designará, de entre el personal de los Departamentos Coordinados, el Secretario 
Coordinador y demás funcionarios que consulte la organización del sistema. 

e. Resolverá cualquier consulta, ya sea de carácter técnico o administrativo que 
sobre los planes aprobados, le sometiere el Secretario Coordinador. 


f. Tendrá además, las otras atribuciones que se le fijen en el Reglamento de 
Coordinación. 


Artículo 8. Son atribuciones y deberes del Secretario Coordinador: 


a. Organizar y dirigir el trabajo del Organismo coordinador, distribuyendo los 
asuntos entre las diferentes secciones. 


b. Presentar por intermedio del Organismo Coordinador, al Consejo Técnico de 
Estadística y Censos informes trimestrales sobre la marcha del trabajo; además, deberá 
someter, por el mismo órgano regular, los proyectos de reformas que necesiten hacerse 
en los programas aprobados. 


Cc. Firmar las comunicaciones que a nombre del Organismo Coordinador se 
dirijan; y, 

d. Ejercer las demás funciones que el Organismo Coordinador le asigne. 

Artículo 9. Reemplazará al Secretario Coordinador el funcionario que designe 
el Organismo de la Coordinación. 

Artículo 10. Queda autorizado el Organismo Coordinador, para la elaboración 
de un reglamento que regule el Sistema de Coordinación, el mismo que será sometido 
a la aprobación del Consejo Técnico de Estadística y Censos. 

Artículo 11. Encárguese de la ejecución del presente Decreto, que entrará en 
vigencia a partir de su publicación en el Registro Oficial, a los señores Ministros; Secre- 
tarios de Estado en las Carteras de Gobierno, Economía y Defensa Nacional. 

Dano, en el Palacio Nacional, en Quito, a 7 de Octubre de 1959. [Firmado] 
C. PoncE ENRIQUEZ. 





INSTITUTE AFFAIRS — ACTIVIDADES 
DEL INSTITUTO 


(Shurce: Secretariat—Fuente: Secretaría) 


VI SESSION OF THE CENSUS 
SUBCOMMITTEE OF COINS 


eo The Census Subcommittee of the Com- 
mittee on Improvement of National Sta- 
tistics (COINS) of the Inter American 
Statistical Institute (IASI) helds its VI 
Session in Ottawa, Canada, during the 
period October 19-28, 1959. 

The following Subcommittee members 
participated in the Session: Calvert L. 
Dedrick (United States), chairman; Ovídio 
de Andrade Jr. (Brazil); Jorge A. Barsoba 
(Argentina); David H. Jones (Canada); 
José V. Montesino Samperio (Venezuela); 
and Tulo H. Montenegro, secretary general 
of IASI, officio member. Herbert 
Marshall, president of the Executive Com- 
mittee of IASI, also attended the Session. 

Additional participants were: Abraham 
Aidenoff, as observer of the United Nations 
Statistical Office; Walter E. Duffett, John 
T. Marshall, Harold McLeod, and Vincent 
R.  Berlinguette as observers of the 
Dominion Bureau of Statistics of Canada; 
and Efraim Murcia-Camacho and César A. 
Molestina of the IASI Secretariat. 


as ex 


The principal result of this Session was 
the preparation of an analytical report 
expressing the American regional point of 
view with respect to the draft proposals 
of the UN Statistical Office on industrial 
inquiries. The report, entitled “Observa- 
tions on the United Nations Document 
“Draft Proposals for the 1963 World 
Programme of Basic Industrial Inquiries,' ” 
has been sent to the UN Statistical Office, 
which will take it into consideration in 
preparing a revised edition of the “Draft 
Proposals,'” which wiil be presented to the 
UN Statistical Commission for consideration 
during its XI Session scheduled for April 
18 — May 6, 1960. 

The Subcommittee also considered the 
status of development of the census pro- 


VI SESION DE LA SUBCOMISION 
DE COINS PARA CENSOS 


e La Subcomisión para Censos de la Co- 
misión de Mejoramiento de las Estadísticas 
Nacionales (COINS) del Instituto Intera- 
mericano de Estadística (IASI) realizó su 
VI Sesión en Ottawa, Canada, del 19 al 
28 de octubre de 1959, 

Participaron los siguientes miembros 
de la Subcomisión: Calvert L. Dedrick 
(Estados Unidos), presidente; Ovídio de 
Andrade Jr. (Brasil); Jorge A. Barsoba 
(Argentina); David H. Jones (Canadá); 
José V. Montesino Samperio (Venezuela); 
y Tulo H. Montenegro, secretario general 
del TASI, como miembro ex officio. Her- 
bert Marshall, presidente del Comité Eje- 
cutivo del IASI, también asistió a la Sesión. 

Participaron además: Abraham Aidenoff 
como observador de la Oficina de Estadís- 
tica de las Naciones Unidas; Walter E. 
Duffett, John T. Marshall, Harold McLeod 
y Vincent R. Berlinguette, como observa- 
dores de la Dirección de Estadística del 
Dominio de Canadá; y Efraim Murcia-Ca- 
macho y César A. Molestina de la Secretaría 
del IASI. 

El resultado principal de esta Sesión fue 
la preparación de un informe analítico en 
el cual se expresa el punto de vista regio- 
nal americano con respecto al proyecto de 
propuestas de la Oficina de Estadística de 
las NU sobre las encuestas industriales. 
Este informe titulado “Observaciones sobre 
el Documento de las Naciones Unidas titu- 
lado “Proyecto de Propuestas para el Pro- 
grama Mundial de Encuestas Industriales 
Básicas de 1963,” *” fue enviado a la Oficina 
de Estadística de las NU quien lo tomará 
en consideración en la preparación de la 
edición revisada del “Proyecto de Propues- 
tas,” que será presentada a la consideración 
de la Comisión de Estadística de las NU 
durante su XI Período de Sesiones progra- 
mado para abril 18 — mayo 6, 1960. 

La Subcomisión también consideró el es- 
tado de desarrollo del programa censal de 
América y, en particular acordó que el 
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gram for America and, in particular, agreed 
that the cycle of economic censuses within 
the program should include, in addition 
to industrial censuses, trade (business), 
services, transportation and communica- 
tions, the proposed recommendations for 
which will be discussed by the Subcommit- 
tee during its next session scheduled to be 
held September 19-30, 1960, in Guatemala 
City, prior to their presentation to COINS 
for approval at the VII Session of the 
Committee in November of that year. 
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ciclo de los censos económicos de dicho 
programa incluya, además de los censos 
industriales, los de comercio, servicios, 
transportes y comunicaciones, cuya propues- 
ta de recomendaciones será objeto de dis- 
cusión por la Subcomisión durante su pró- 
xima sesión programada para septiembre 
19-30 de 1960, en la Ciudad de Guatemala. 
Posteriormente la citada propuesta será 
presentada a la VII Sesión de COINS en 
noviembre del mismo año, para su apro- 
bación. 


VI Session of the Census Subcommittee of COINS, Dominion Bureau of Statistics, Ottawa, Canada, 
October 1959. — VI Sesión de la Subcomisión de COINS para Censos, Dirección de Estadística del 


Dominio, Ottawa, Canadá, octubre 
Barsoba 
César A. 


1959. From 
Andrade Jr 
Montenegro 


(Argentina), 
Molestina, 


Ovídio de 
Tulo H. 


left to right — De 
(Brazil), 
(IASD, Calvert L. 


izquierda 
Montesino 
Dedrick, 


a derecha: 
Samperio 
chairman 


Jorge A. 
(Venezuela), 
(United States), 


José V. 


Walter E. Duffett (Canada), Efraim Murcia-Camacho (IASD), Abraham Aidenoff (United Nations), 


Vincent R. Berlinguette, David H 


RECENT IASI PUBLICATIONS 


e The Occupational Classification for the 
1960 Census of America (COTA-1960) 
(October 1959, 61 p.) is the outcome of 
adjustments and changes introduced in the 
classification that was adopted under the 
Program of the 1950 Census of the Americas 
(COTA-1950), taking as bases (a) the 
experience acquired by the nations partic- 
ipating in that program, and (b) the 
International Standard Classification of 
Occupations (ISCO) accepted by the IX 
International Conference of Labour Stat- 
isticians for 1960 
censuses. 


application in the 


The classification comprises a listing and 
definitions of major groups and subgroups 


Jones, and Harold McLeod 
[Photo by National Film Board, Canada. ] 


(Canada), 


PUBLICACIONES RECIENTES 
DEL IASI 


e La Clasificación Ocupacional del Censo 
de América de 1960 (COTA-1960) (Julio 
de 1959, 84 p.) es el resultado de ajustes 
y cambios introducidos en la clasificación 
adoptada bajo el Programa del Censo de 
las Américas de 1950 (COTA-1950), toman- 
do como base (a) la experiencia obtenida 
por las naciones participantes en aquel 
programa, y (b) la Clasificación Interna- 
cional Uniforme de Ocupaciones (CIUO) 
aceptada por la IX Conferencia Internacio- 
nal de Estadigrafos del Trabajo para su 
aplicación en los censos de 1960. 

La clasificación comprende una lista y 
definiciones de Grupos Principales y 
Subgrupos; con posibles grupos unitarios 
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with possible unit groups under the sub- 
groups, with further subdivisions in some 
cases. 

The Secretariat of the Inter American 
Statistical Institute, (1IASI) has endeavored 
to incorporate in the present edition 
(published in English and Spanish) of the 
Occupational Classification for the 1960 
Census Of America the  essence of 
the observations formulated in the VI 
Session of the Committee on Improvement 
of National Statistics, in which the draft 
of this classification was discussed, together 
with the subsequent observations made by 
the national offices and by the Interna- 
tional Labour Office. It is hoped that this 
end has been successfully attained by close 
adherence to two basic aims: (a) That of 
keeping intact, insofar as possible, the 
structure of the first system of occupational 
subgroups developed for inter-American 
purposes in the COTA-1950 classification; 
and (b) the aim of achieving the greatest 
possible convertibility of the results of the 
censuses of the American Nations to the 
classification established for world-wide 
purposes. 


e In June 1959, IASI released two parts 
of the second volume of the publication 
La Estructura Demográfica de las Naciones 
Americanas: Análisis Estadístico-Censal de 
los Resultados Obtenidos bajo el Programa 
del Censo de las Américas de 1950 (COTA- 
1950) under the title Características Eco- 
nómicas de la Población, Tomo 1. Pobla- 
ción Económicamente Activa y No Econó- 
micamente Activa. Características Generales 
de la Población Económicamente Activa 
(236 p.). Tomo 2. Características Com- 
binadas de la Población Económicamente 
Activa (282 p.). 

Volume II is the first to be published 
of the two volumes planned. The data 
are set forth in considerable detail, with 
cross-classifications by age, sex, occupation, 
and industry, and accompanied by extensive 
annotations to ensure correct interpreta- 
tion. Copies of volume 11 may be purchas- 
ed at a cost of $2.00 (U.S.) for each 
part. 


e The IASI Secretariat has released the 
following in the series of revised country 
“handbooks” entitled Statistical Activities 
of the American Nations: No. 2, Bolivia 
(August 1957, 48 p.); No. 6, Costa Rica 
(July 1958, 60 p.); No. 8, Chile (June 
1959, 90 p.); No. 10, El Salvador (March 
1959, 48 p.); No. 12, Guatemala (April 
1959, 60 p.); No. 17, Panamá (March 1958, 
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en algunos casos con subdivisiones, bajo los 
subgrupos. 

La Secretaría del Instituto Interamerica- 

no de Estadística (IASI) ha tratado de 
incorporar, en la presente edición (publi- 
cada en inglés y en español) de la Clasifi- 
cación Ocupacional para el Censo de Amé- 
rica de 1960 (COTA-1960), la esencia de 
las observaciones formuladas en la VI Se- 
sión de la Comisión para el Mejoramiento 
de las Estadísticas Nacionales (COINS) en 
la cual fue discutido el respectivo proyecto, 
como también los formulados posterior- 
mente por las oficinas nacionales y por 
la Oficina Internacional del Trabajo. Y 
espera lograrlo atendiendo a dos propósitos 
básicos: (a) Mantener, hasta donde fue 
posible, la estructura del primer sistema 
de subgrupos ocupacionales desarrollados 
para fines interamericanos en la Clasifica- 
ción de COTA-1950: y (b) facilitar al má- 
ximo la conversión de los resultados de los 
censos de las naciones americanas a la 
clasificación establecida para fines de com- 
parabilidad mundial. 
e En junio de 1959, el IASI puso en 
circulación dos partes del segundo volumen 
de la publicación La Estructura Demográ- 
fica de las Naciones Americanas: Análisis 
Estadístico-Censal de los Resultados Obte- 
nidos bajo el Programa del Censo de las 
Américas de 1950 (COTA-1950) bajo el títu- 
lo Características Económicas de la Pobla- 
ción, Tomo 1. Población Económicamente 
Activa y No Económicamente Activa. Ca- 
racterísticas Generales de la Población 
Económicamente Activa (236 p.). Tomo 2. 
Características Combinadas de la Población 
Económicamente Activa (282 p.). 

El Volumen 1 es el primero de los dos 
volúmenes proyectados. Los datos se pre- 
sentan considerablemente detallados, con 
clasificaciones cruzadas por edad, sexo, 
ocupación, e industria, y acompañadas por 
extensas anotaciones para asegurar inter- 
pretaciones correctas. Ejemplares del vo- 
lumen 11 pueden adquirirse al costo de 
$2.00 (U.S.) por parte. 


e La Secretaría del JASI editó los si- 
guientes manuales revisados de la serie ti- 
tulada Actividades Estadísticas de las Na- 
ciones Americanas: No. 2, Bolivia (agosto 
de 1957, 48 p.); No. 6, Costa Rica (julio 
dc 1958, 60 p.); No. 8, Chile, (junio de 
1959, 90 p.); No. 10, El Salvador (marzo 
de 1959, 48 p.); No. 12, Guatemala (abril 
de 1959, 60 p.); No. 17, Panamá (marzo 
de 1958, 73 p.); No. 18, Paraguay (septiem- 
bre de 1959, 44 p.). Para infcrmación so- 
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73 p.); No. 18, Paraguay (September 1959, 
44 p.). For information on others publish- 
ed in the series, refer to Estadística No. 57, 
p. 824. Copies of the “handbooks” are 
available at a price of $0.25 (U.S.) each. 
eo A third edition of the Guide to the 
Classification of Countries and Places for 
Foreign Trade Statistics — Guía para la 
Clasificación de Países y Lugares en las 
Estadísticas del Comercio Exterior (93 p.) 
was released in 1959. (See note on previous 
editions in Estadística No. 58, p. 124.) This 
edition brings the information up to date 
to reflect anticipated conditions as of 
January 1, 1959, Copies are available at a 
price of $0.50 (U.S.) each. Orders for any 
of the above publications should be direct- 
ed to the Office of Publications Services, 
Pan American Union, Washington 6, D.C. 


NEW BIETA VOLUME 


eo The Committee on Statistical Education 
of the Inter American Statistical Institute 
(LASI) has released a Spanish translation 
of A Dictionary of Statistical Terms, 
prepared by Prof. M. G. Kendall and Dr. 
W.R. Buckland at the invitation of the 
International Statistical Institute and with 
financial support from the United Nations 
Educational, Scientific and Cultural Or- 
ganization. (See Estadística No. 56, p. 663, 
for description of English version.) The 
translation, made by Raúl A. Huerta, 
appears under the title, Diccionario de 
Términos Estadísticos (1959, 482 p.). 

This book is part of Section B of the 
IASI Inter-American Textbook Series on 
Theoretical and Applied Statistics (BIETA). 
Copies may be obtained at the price of 
300 pesos (Arg.) each by writing to “Edi- 
torial APIS, Calle Presidente Roca No. 150, 
Rosario, Argentina.” 
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bre otras publicaciones de la serie, ver 
Estadística No. 57, p. 824. Ejemplares de 
los manuales pueden obtenerse al precio 
de $0.25 U.S. cada uno. 


e La tercer edición de la Guía para la 
Clasificación de Países y Lugares en las 
Estadísticas del Comercio Exterior — Guide 
to the Classification of Countries and 
Places for Foreign Trade Statistics (93 p.) 
apareció en 1959. (Ver nota sobre la an- 
terior edición en Estadística No. 58, p. 124.) 
Esta edición trae la información al día 
reflejando condiciones anteriores al 1 de 
enero de 1959. Cada ejemplar puede ob- 
tenerse al precio de $0,550 (U.S.). Las 
publicaciones antes mencionadas pueden 
solicitarse directamente a la Oficina de Ser- 
vicios de Publicación, Unión Panamericana, 
Washington 6, D.C. 


NUEVO VOLUMEN DE BIETA 


e La Comisión de Educación Estadística 
del Instituto Interamericano de Estadística 
(IASI) ha puesto en circulación la tra- 
ducción española del A Dictionary of Sta- 
tistical Terms, que prepararon el Prof. 
M.G. Kendall y el Dr. W.R. Buckland 
por invitación del Instituto Internacional 
de Estadística y con la ayuda financiera 
de la Organización de las Naciones Unidas 
para la Educación, la Ciencia y la Cultura. 
(Ver Estadística No. 56, p. 663, para la 
descripción de la versión inglesa.) La tra- 
ducción realizada por Raúl A. Huerta, apa- 
rece bajo el título de Diccionario de Tér- 
minos Estadísticos (1959, 482 p.). 


Este volumen forma parte de la Sección 
B de la Biblioteca Interamericana de Esta- 
dística Teórica y Aplicada (BIETA) del 
IASI. Pueden obtenerse copias al precio 
de 300 pesos argentinos por ejemplar, es- 
cribiendo a Editorial APIS, Calle Presi- 
dente Roca No. 150, Rosario, Argentina. 
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NUEVOS MIEMBROS 


Elías Febres Cordero 
Venezuela 
Subjefe, Sección de Estadística, 
Departamento de Investigacio- 
nes Económicas, Banco Central. b 
Miembro titular. 


Ernesto Simó Clark 
República Dominicana 
Director general, Dirección 
General de Estadística, Secre- 
taría de Estado de lo Interior 
y Comunicaciones. Miembro 
ex-officio. 


Juvenal Utrera Velásquez 
Venezuela 
Director general, Dirección 
General de Estadística y Censos 
Na::onales. Miembro titular. 


the 
Estadística 
members 


* This concludes 
(series initiated in 
furnished by all 


presentation of 
No. 62) 
Finaliza 


aquí la presentación de 


photographs of constituent 
The presentation is incomplete since photographs were not 
las 


DEL IASI * 


Jorge Peralta Rojas 
Venezuela 
Asesor de Estadística y Proce- 
dimientos (Impuestos sobre la 
Renta), Ministerio de Hacien- 
da. Miembro titular. 


Enrique Cansado 
Not on national quotas 
Profesor de Estadística General, 
Centro Interamericano de En- 
señanza de Estadística Econó- 
mica y Financiera (CIEF). 
Miembro titular. 


members elected in 1958 


fotografías de los miembros 


titulares elegidos en 1958 (la serie se inició en Estadística No. 62). Esta presentación fue incompleta 


porque no todos los miembros enviaron su fotografía. 
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PERSONAL NOTES 


e In July 1959, Mr. Tulo H. Montenegro, secretary general of IASÍ, represented the 
Institute at the following meetings, which were held at the Pan American Union: IV 
Meeting of Technical Cooperation Board, II Meeting of the Administrative Heads of 
the Specialized Organizations with the Secretary General of the Organization of American 
States. 


e The following members of the Staff of the IASI Secretariat attended the VI Session 
of the Census Subcommittee of COINS in Ottawa, October 19-30, 1959: Tulo H. Monte- 
negro, secretary general; Efraim Murcia-Camacho, program specialist in industrial and 
transportation statistics; César A. Molestina, program specialist (Program of the 1960 
Census of America); and César A. Orantes and Frank D. Monisera of the conference 
and editorial section. 


e Dr. O. Alexander de Moraes, assistant secretary general and constituent member of 
IASI, represented the Organization of American States, and Prof. William Madow, 
constituent member of IASI, served as the representative of the Institute at the Stanford 
Conference on Latin America which was held in California during the period 
October 9-11, 1959. 


e Dr. Moraes then participated as an observer in the experimental census of agriculture 
which was taken in Pamama, October 11-14, 1959. 


eo Miss Ana G. Casís, program specialist (Program of the 1960 Census of America) 
and Mr. Roque García-Frías, program specialist in demographic and health statistics, 
visited the Dirección General de Estadística, Honduras and Guatemala, in September 
1959, to observe various aspects of the experimental censuses of population, housing, 
and agriculture. Miss Casís also visited the offices of Nicaragua and El Salvador; Mr. 
Garcia-Frías went to Panama and Costa Rica. 


e Mr. Douglas H. Parks, program specialist in international trade statistics, Department 
of Statistics, Pan American Union, represented IASI at the meeting of the Group of 
Experts at the United Nations Headquarters in October 1959, to revise the SITC-BTN II. 
The SITG-BTN is the proposed unification of the Standard International Trade Clas- 
sification and the Brussels Tariff Nomenclature. 


e Dr. Clotilde A. Bula, editor of the IASI Journal, and Dr. Adolfo Morales, vice- 
president of IASI, represented the Institute at the XI Pan American Child Congress, 
in Bogotá, Colombia, November 1959. 


e Mr. Garcia-Frías, and Dr. Bula represented the Institute at the Seminar on Evaluation 
and Utilization of Results of Population Censuses in Latin America, which was held 
in Santiago, November 30-December 18, 1959. 


e Mr. Horacio D'Ottone resigned from his position as program specialist in statistical 
education in the IASI Secretariat as of December 1959 and reassumed his 
jefe, Sección de Estadística y Publicaciones, Departamento de Investigaciones Económicas, 
Banco Central de Chile, in Santiago. During the period November 29-December 16, 
1959, he visited the national statistical offices in Colombia, Cuba, Dominican Republic, 
Haiti, Panama, and Venezuela in connection with the presentation of candidates for 
the Central American and Caribhean Basic Statistical Training Course. 


post as 


e Individuals recently acquiring ex officio membership status in the Inter American 
Statistical Institute: 


Dominican Republic: Mr. Ernesto Simó Clark, director general, Dirección 
General de Estadística, Ciudad Trujillo. 


Guatemala: Mr. Francisco López Granados, director general, Dirección 
General de Estadística, and representative of the Government of Guatemala. 
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INTERNATIONAL 


Seminar on use of census data 


eo The United Nations Seminar on 
Evaluation and Utilization of Population 
Census Data in Latin America was held 
in Santiago, Chile, from November 30 to 
December 18, 1959. It was organized by 
the Bureau of Social Affairs, the Economic 
Commission for Latin America, the Sta- 
tistical Office of the United Nations (UN), 
and the UN Bureau of Technical Assistance 
Operations, in with the 
Government of Chile and the Inter Amer- 
ican Statistical Institute, and with financial 
assistance from the Population Council, 
Inc. Representing the UN, the Demograph- 
ic Centre for Latin America (CELADE), 
located in Santiago, conducted the Seminar. 


collaboration 


The Seminar was organized to aid the 
countries of the region in the utilization 
of data from the population censuses, to 
be taken in or around 1960, in the 
preparation of plans for economic and 
social development and in the formulation 
of policies related with such plans. 

In order that the Seminar participants 
include not only those persons responsible 
for the production of population census 
data but also the technicians who in one 
way or another use the data, each Govern- 
ment of the region was invited to designate 
at least two experts in any of the following 
fields: Economic and social planning and 
action; census administration and plan- 
ning; economic, social, and demographic 
statistics. Among others, the participants 
included representatives from 16 Latin 
American nations, the United States of 
America and three international agencies: 
Inter American Statistical Institute, United 
Nations Educational, Scientific and Cultural 
Organization, and Pan American Sanitary 
Bureau. (Source: Carmen Miró, CELADE, 
Chile, November 1959.) 


Seminario sobre 


censales 


utilización de resultados 


e El Seminario de las Naciones Unidas 
sobre Evaluación y Utilización de Resulta- 
dos de Censos de Población en América 
Latina se celebró en Santiago de Chile, 
desde el 30 de noviembre hasta el 18 de 
diciembre, 1959. Fue organizado por la 
Dirección de Asuntos Sociales, la Comisión 
Económica para América Latina, la Ofici- 
na Estadística de las Naciones Unidas 
(NU), y la Dirección de Operaciones de 
Asistencia Técnica de NU, en colaboración 
con el Gobierno de Chile y el Instituto 
Interamericano de Estadística y con la 
ayuda financiera del Population Council, 
Inc. En representación de NU, el Centro 
Latinoamericano de Demografía (CELADE), 
que funciona en Santiago, dirigió el Se- 
minario. 

El Seminario se organizó con el propó- 
sito de prestar ayuda a los países de la 
región en la utilización de los resultados 
de los censos de población, que se levan- 
tarán en 1960 o alrededor de esa fecha, en 
la preparación de planes de desarrollo eco- 
nómico y social y en la formulación de 
políticas relacionadas con tales planes. 

Para que en el Seminario participaran 
no solamente los responsables de la pro- 
ducción de las cifras censales, sino también 
los técnicos que de una manera u otra 
utilizan los resultados de los censos de 
población, cada gobierno de la región fue 
invitado a designar, al menos, dos expertos 
en cualquiera de los siguientes campos: 
planificación y acción económica y social; 
administración y planificación censal; es- 
tadísticas económicas, sociales y demográfi- 
cas. Entre los participantes asistieron re- 
presentantes de 16 países latinoamericanos, 
de los Estados Unidos y de tres organiza- 
ciones internacionales: Instituto Interame- 
ricano de Estadística, Organización de las 
Naciones Unidas para la Educación, la 
Ciencia y la Cultura y la Organización 
Sanitaria Panamericana. (Fuente: Carmen 
Miró, CELADE, Chile, noviembre 1959.) 
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Participants in the United Nations Seminar on Evaluation and Utilization of Population 


Census Data in Latin America, Santiago, Chile, November 30 — December 18, 1959. — 
Participantes en el Seminario de las Naciones Unidas sobre Evaluación y Utilización 


de Resultados de Censos de Población en América Latina, Santiago, Chile, noviembre 30 


— diciembre 18, 1959. 


HT Regional Seminar on 
Social Affairs 


e The III Regional Seminar on Social 
Affairs took place in Bogotá, Colombia, 
from June 13-20, 1959. Delegates from Bo- 
livia, 


Colombia, Ecuador, 


and Venezuela attended. 


Panama, Peru, 
Observers of dif- 
ferent national and international organiza- 
tions were also present. Various aspects of 
social and economic development programs 
were discussed, and it was recommended 
that adequate statistics should be prepared 
so that the nature and extent of economic 
and social phenomena could be accurately 
defined. The representative of the Inter 
American Statistical Institute (TASI) of- 
fered the technical cooperation of IASI in 
matters relating to the training of qualified 
personnel and the improvement of statis- 
tical methods in the countries of the region. 


(Source: Luis Thorin Casas, Bogotá, June 
1959.) 


[IT Seminario Regional de 
Asuntos Sociales 
e Entre los días 13 y 20 de junio de 1959, 
se realizó en Bogotá, Colombia, el III Se- 
minario Regional de Asuntos Sociales, al 
cual asistieron delegados de Colombia, Bo- 
livia, Ecuador, Panamá, Perú, Venezuela, 
y observadores de distintos organismos in- 
ternacionales y nacionales. Se trataron di- 
versos aspectos relacionados con los Progra- 
mas Sociales y de Desarrollo Económico, 
recomendándose la elaboración de estadís- 
ticas adecuadas poder definir, con 
precisión, la naturaleza y extensión de Jos 
fenómenos económicos y sociales. El re- 
presentante del Instituto Interamericano de 
Estadística ofreció la colaboración técnica 
del mismo para la preparación del personal 
idóneo, así 


para 


todo lo relacionado 
con el mejoramiento de los métodos esta- 
dísticos de los países bolivarianos. (Fuente: 
Luis Thorin Casas, Bogotá, junio de 1959.) 


como en 
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UN Statistical Yearbook, 1958 


eo The tenth issue of the Statistical 
Yearbook, a 612-page volume, prepared bi 
the Statistical Office of the United Nations 
(UN), was printed in February 1959. It 
contains 187 tables, an appendix, and 
alphabetical subject and country indexes. 
All titles, headings, notes and text are in 
both English and French. 

The territorial coverage of the tables is 
as world-wide as the available information 
permitted and a large number of tables 
give world totals. A special endeavour has 
been made to present the statistical series 
for the various countries on as comparable 
a basis as possible. The bulk of the tables 
cover the inmediate prewar period, 1948, 
and some seven most recent years; a few 
tables show data relating to 1958 and in 
the table on public finance the forward 
estimates include 1959. 

This issue contains an important new 
chapter on world production of primary 
commodities and manufactured goods, and 
new tables on the weighting pattern for 
industrial production, world experts by 
provenance and destination, and trends in 
world trade 1938 compared with 
trends in population and production. 
Another new table is a summary of inter- 
national economic aid to under-developed 
countries by 


since 


contributing countries and 
agencies. 


Information is presented under the fol- 
lowing chapter headings: Population, man- 
power, production summary, agriculture, 
forestry, fishing, industrial production 
(mining and manufacturing), mining and 
quarrying, manufacturing, construction, 
electricity and gas, consumption, transport, 
communications, internal trade, external 
trade, balance of payments, international 
economic aid, wages and prices, national 
income, finance, public finance, social sta- 
tistics and education and culture. 


The price of the 1958 Yearbook is $8.00 
(U.S.) clothbound and $6.50 (U.S.) 
paperbound. Copies may be obtained at 
the equivalent in national currency of 
these prices from UN sales agents, the 
names of which appear on the inside back 
cover of most UN publications. Govern- 
ment agencies may obtain a 50 percent 
discount by ordering through their delega- 
tion to the UN. (Source: UN Summarv 
of Contents of the publication mentioned.) 
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Anuario estadístico de NU, 1958 


e la décima edición del Statistical 
Yearbook, un volumen de 612 páginas, pre- 
parado por la Oficina Estadística de las 
Naciones Unidas (NU), fue imprimida en 
febrero de 1959. Contiene 187 cuadros, un 
apéndice, e índices alfabéticos por materias 
y países. Todos los títulos, encabezamien- 
tos, notas y el texto están en inglés y 
francés. 

La cobertura territorial de los cuadros es 
mundial cuando lo ha permitido la infor- 
mación disponible y un gran número de 
cuadros dan totales mundiales. Se ha hecho 
un esfuerzo especial para presentar las se- 
ries estadísticas de los diversos países sobre 
bases comparables en la medida posible. 
La parte principal de los cuadros cubren 
el período inmediato de la preguerra, 1948, 
y de los últimos siete años; unos pocos 
cuadros presentan datos relativos a 1958 y 
en el cuadro sobre finanzas públicas las 
estimaciones se extienden hasta 1959, 

Esta edición contiene un importante nue- 
vo capítulo sobre la producción mundial 
de materias primas y bienes manufactura- 
dos, y nuevos cuadros sobre las ponderacio- 
nes para la producción industrial, exporta- 
ciones mundiales por procedencia y des- 
tino, y tendencias del comercio mundial 
desde 1938 comparadas con las tendencias 
de la población y la producción. Otro 
cuadro nuevo es el que resume la asistencia 
económica internacional a los países sub- 
desarrollados por países y agencias contri- 
buyentes. 

La información se presenta bajo los si- 
guientes capítulos titulados: Población, 
mano de obra, resumen de la producción, 
agricultura, silvicultura, pesca, producción 
industrial, minas y canteras, industrias ma- 
nufactureras, construcción, electricidad y 
gas, consumo, transportes, comunicaciones, 
comercio interior, comercio exterior, balan- 
za de pagos, asistencia económica interna- 
cional, salarios y precios, ingreso nacional, 
finanzas, finanzas públicas, estadísticas so- 
ciales, y educación y cultura. 

El precio del Yearbook de 1958 es de 
$8.00 (U.S.) encuadernado en tela y de 
$6.50 (U.S.) en rústica. Pueden obtenerse 
ejemplares al equivalente en moneda na- 
cional de esos precios, convertidas al cambio 
corriente, en la agencias de ventas de NU. 
Las oficinas de gobierno pueden obtener 
un descuento de 50 porciento solicitándolo 
por intermedio de su delegación ante las 
NU. (Fuente: Resumen de las NU del 
contenido de la mencionada publicación.) 
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Manual on data processing 
methods 


e The preparation of data 
processing methods has been undertaken 
jointly by the Statistics Branch of the Food 
and Agriculture Organization of the United 
Nations and the United Nations Statistical 
Office for the purpose of helping under- 
developed resolve the dif- 
ficulties which many of them have in the 
processing of statistical data. 

Of the 12 planned (see IASI 
Estadística No. 59-60, p. 342), 5 have already 
been completed: 


studies on 


countries to 


studies 


(1) Scope and principal 


methods for data processing; (2) planning, 


organization, and administration of the 


data processing services; (3) the elements 
of planning and operation of an instal- 
lation for punched cards; (4) manual and 
mechanical methods for data processing; 
(5) separation of punched cards. 

These five studies were later published 
in a single volume and translated by the 
Department of Statistics of the Pan Amer- 
ican Union under the title, Manual sobre 
Métodos para la Datos 
(part 1, provisional September 
1959, 156 p.). This publication may be 
purchased from the Office of Publications 
Services, Pan American Union, Washington, 
D.C., at $1.00 (U.S.) each. 


Elaboración de 


edition, 


Standardization of labour statistics 

e The 1959 edition of The International 
Standardization of Labour Statistics (Ge- 
neva, 124 p.) includes the developments in 
the international standardization of labour 
statistics which have occurred since the 
second edition was issued in 1943. 

The first part of this International 
Labour Office publication consists of a 
general description of the work done at 
the international level. The second part 
reproduces the basic documents containing 
international standards in the field of 
labour statistics, divided into sections ac- 
cording to subject matter. Each section 
comprises an introduction, a list of refer- 
ences and the relevant texts. The introduc- 
tion to each section presents a brief sketch 
of the history of international action in 
the development of international standards 
in the field of ,labour statistics under 


Manual sobre métodos para 
la elaboración de datos 

e La preparación de estudios sobre mé- 
todos para la elaboración de datos ha sido 
emprendida, juntamente, por la Sección 
Estadística de la Organización de las Na- 
ciones Unidas para la Agricultura y la Ali- 
mentación y por la Oficina de Estadística 
de las Naciones Unidas, con el propósito 
de ayudar, a los países subdesarrollados, a 
resolver las dificultades que tienen, muchos 
de ellos, en la elaboración 
dísticos. 


de datos esta- 


De los 12 estudios proyectados (ver JASI 
Estadística No. 59-60, p. 342), se han com- 
pletado 5: (1) Alcance y métodos princi- 
pales para la elaboración de datos; (2) 
planeamiento, organización y administra- 
ción de los servicios de elaboración de da- 
tos; (3) los elementos de planificación «y 
operación de una instalación para tarjetas 
perforadas; (4) métodos manuales e ins- 
trumentos para la elaboración de datos; 
(5) separación de tarjetas perforadas. 

Estos cinco estudios fueron traducidos y 
luego publicados en un volúmen único por 
el Departamento de Estadística de la Unión 
Panamericana bajo el título, Manual sobre 
Métodos para la Elaboración de Datos 
(parte I, edición provisional, septiembre 
1959, 156 p.). Esta publicación puede ob- 
tenerse en la Oficina de Servicios de Pu 
blicaciones, Unión Panamericana, Wash 
ington, D.C. a$1,00 (U.S.) cada ejemplar. 
Estandarización de las estadísticas 
del trabajo 


e la edición del 1959 de The 
International Standardization of Labour 
Statistics (Ginebra, 124 p.) incluye el de- 
sarrollo verificado, desde la segunda edición 
aparecida en 1943, en la estandarización 
internacional de las estadísticas del trabajo. 

La primera parte de esta publicación de 
la Oficina Internacional del 
tiene una descripción general del trabajo 
realizado a nivel internacional. La segunda 
parte reproduce los documentos básicos que 


año 


Frabajo, con- 


contienen los estándares internacionales de 
las estadísticas del trabajo, dividida en sec- 
ciones de acuerdo a los principales tópicos. 
Cada sección comprende una introducción, 
una lista de referencias y de textos impor- 
tantes. La introducción de cada sección 
presenta un breve esbozo histórico de la 
acción internacional en el desarrollo de los 





review. The introduction, together with 
the references following it, will enable 
readers interested in the historical develop- 
ment of the international standards to fol- 
low it in all its details, The various sec- 
tions cover that part of the statistical 
domain which is commonly considered as 
falling within the province of labour sta- 
tistics, and for which pertinent interna- 
tional standards have been adopted. 
(Source: The publication mentioned.) 


Consumer price indexes 


e The importance that consumer price 
(cost-of-living) indexes be recognized as 
elements which give an  approximate 
picture of the living conditions of towns, 
and their variations, has led to publication 
of Indices de Precios al Consumidor (Costo 
de la Vida) de las Naciones Americanas: 
Enero de 1955 a Mayo de 1959 (1959, 47 p.). 
This bulletin, prepared by the Department 
of Statistics of the Pan American Union 
(PAU), presents monthly index numbers 
for all of the American nations. 


In order to achieve a uniform presenta- 
tion there were three types of adjustments 
in the national data collected for this 
publication: (1) Reduction of the indexes 
to a common base—the year 1955; (2) 
presentation, wherever possible, of five 
indexes for each nation: Total, food, hous- 
ing, clothing, and other expenses; (3) 
standardization of the titles of the five 
indexes. 

This publication may be purchased from 
the Office of Publications Services, Pan 
American Union, Washington, D.C., at 
$0.25 (U.S.) per copy. (Source: The 
publication mentioned.) 


PAU publication on 
industrial data 


e In compliance with a recommendation 
of the Inter-American Committee of 
Presidential Representatives in 1957, the 
Department of Statistics PAU has been 
working out a plan which will be 
proposed to the national statistical of- 
fices of Latin America. The objective 
of the plan is to  systematize the 
collection of statistical information on 
the industrial activity of the American 
nations, therebv making it possible to have 
periodic publication of comparable data. 
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estándares de las estadísticas del trabajo 
examinadas. La introducción, junto con las 
referencias que siguen, permiten a los lec- 
tores interesados en el desarrollo histórico 
de los estándares internacionales seguirlo 
en todos sus detalles. Las diferentes seccio- 
nes cubren sólo aquella parte del dominio 
de las estadísticas del trabajo que han sido 


objeto de estandarización internacional. 


(Fuente: La publicación mencionada.) 


Índices de precios 
al consumidor 


e La importancia que se reconoce a los 
índices de precios al consumidor (costo de 
vida) como elementos que señalan, en 
forma aproximada, las condiciones de vida 
de los pueblos y sus variaciones, han con- 
ducido a la preparación de la publicación 
de Indices de Precios al Consumidor (Costo 
de la Vida) de las Naciones Americanas: 
Enera de 1955 a Mayo de 1959 (1959, 
17 p.). Este boletín, preparado por el De- 
partamento de Estadística de la Unión Pa- 
namericana (UP), presenta números índices 
mensuales de todas las naciones americanas. 

Con el objeto de lograr una presentación 
uniforme se han hecho tres tipos de ajus- 
tes en los datos nacionales reunidos para 
esta publicación: (1) La reducción de los 
índices a una base común, el año 1955; 
(2) la presentación, siempre que fue posi- 
ble, de cinco índices para cada nación: 
total, alimentación, vivienda, vestuario y 
otros gastos; (3) la uniformación de las 
denominaciones para los cinco índices. 

Esta publicación puede obtenerse en la 
Oficina de Servicios de Publicaciones, UP, 
Washington, D.C., a $0,25 (U.S.) por 
ejemplar. (Fuente: La publicación men- 
cionada.) 


Publicación de la UP 
sobre estadísticas industriales 


e De acuerdo con una recomendación de 
1957 del Comité Interamericano de Repre- 
sentantes de los Presidentes, el Departa- 
mento de Estadística de la UP adelanta 
los estudios para la formulación de un 
plan que será propuesto a las ofici- 
ras nacionales de estadística de Amé- 
rica Latina. El objetivo del plan es 
sistematizar la obtención de información 
estadística de la actividad industrial de 
las naciones americanas, que permita la 
publicación periódica de datos compara- 
bles. Acorde con este objetivo, en sep- 
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In line with this objective, in September 
1959, the Department of Statistics released 
a preliminary and exploratory summary 
under the title Censos y Encuestas Indus- 
triales de las Naciones Americanas: Resu- 
men de los Ultimos Resultados Disponibles, 
Septiembre de 1959 (95 p.). 

The first part of the publication is 
composed of the national totals taken from 
the more detailed data presented in the 
second part. The six basic tables cover: 
(1) input and output data, and value add- 
ed; (2) personnel; (3) man-hours, salaries 
and wages; (4) installed power equipment; 
(5) expenditures on fixed assets; (6) value 
of stocks. (Source: The publication 
mentioned.) 


New bulletin on agricultural 
statistics and economy 


eo The 

Economy 
Secretary, 
lication of 


General Bureau of Agricultural 
(DGEA), in the Agricultural 
under their program for pub- 

information useful to agri- 
cultural sectors and those related with 
economic development, initiated a new 
publication series in January 1959 under 
the title, Boletín de Estadística y Economía 
Agropecuaria. 

The bulletin appears bimonthly with 
data presented for each month under the 
following general sections: Agricultural 
statistics, livestock statistics, and agricultu- 
ral economy. (Sources: Fernando José Gar- 
cía, DGEA, Buenos Aires, November 1959; 
the publication mentioned.) 


Noticias personales 


tiembre de 1959, el Departamento de Esta- 
dística publicó un resumen preliminar y 
exploratorio bajo el título Censos y En- 
cuestas Industriales de las Naciones Ameri- 
canas: Resumen de los Ultimos Resultados 
Disponibles, Septiembre de 1959 (95 p.). 

La primera parte de la publicación está 
compuesta por los totales nacionales obte- 
nidos de cuadros más detallados que se 
presentan en la segunda parte. Los seis 
cuadros básicos comprenden: (1) Gastos de 
consumo, trabajos y servicios, producción 
y valor agregado; (2) personal ocupado; 
(3) horas-hombre, sueldos y salarios pa- 
gados; (4) equipo de fuerza instalado; (5) 
inversiones en bienes del activo fijo; (6) 
valor de las existencias. (Fuente: La pu- 
blicación mencionada.) 


TINA 


Nuevo boletín sobre estadísticas 
y economia agroped uarias 


e La Dirección General de Economía 
Agropecuaria (DGEA) de la Secretaría de 
Agricultura y Ganadería, bajo su programa 
de difusión de informaciones estadísticas, 
destinadas a los sectores agropecuarios y 
a aquellos vinculados al desarrollo econó 
mico, inició una nueva serie de publicacio- 
nes, en enero de 1959, titulada: Boletín de 
Estadística y Economía Agropecuaria. 

El boletín es bimestral y contiene esta- 
dísticas mensuales presentadas en tres sec- 
ciones generales: Estadísticas agrícolas, es- 
tadísticas ganaderas y economía agrope- 
cuaria. (Fuentes: Fernando José García, 
DGEA, Buenos Aires, noviembre 1959; la 
publicación mencionada.) 


e El Sr. Angel Ramón Caram, subdirector de Política Económica y Financiera, Secretaría 


de Finanzas, Ministerio de Economía, Buenos Aires, se encuentra en Washington, D.C., 


desde septiembre de 1959, para asistir durante un año al curso que auspicia el Banco 


Monetario Internacional sobre técnicas monetarias v financieras internacionales, y análisis 


de estadísticas económicas. 


e El Sr. Camilo Dagum, profesor de estadística matemática, Facultad de Ciencias Eco- 


nómicas, Universidad Nacional de Córdoba, fue elegido miembro titular del Instituto 


Internacional de Estadística en noviembre de 1959. 
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BRASIL 


Noticias pessoais 


e O Professor Germano Jardim, após mais de trinta e sete anos de atividade no campo 
da estatística, afastou-se do servico público, em virtude de lhe ter sido concedida aposen 
tadoria. O aposentado, por ocasiáo de seu afastamento exercia as seguintes funcóes: 
Chefe, Seccáo de Estudos e Análises e substituto do diretor, Servico de Estatística da 
Educacáo e Cultura do Ministério da Educacáo e Cultura. 


e 0 Dr. Speridiáo Faissol, secretário geral, Conseiho Nacional de Geografia, Instituto 
Brasileiro de Geografia e Estatística (IBGE) visitou o Bureau of the Census dos Estados 
Unidos em agósto de 1959, para discussáo investigadora sóbre a exequibilidade do emprégo 
de equipamento eletrónico na apuracáo dos dados do Recenseamento Geral do Brasil 
em 1960. 


e O Sr. Antonio de Abreu Coutinho, chefe, Seccáo de Comércio Exterior e de Cámbio, 
Superintendéncia da Moeda e do Crédito, Rio de Janeiro, D.F., chegou em setembro 
de 1959, por um ano, em curso patrocinado pelo Fundo Monetario Internacional, para 
um treinamento em técnicas financeiras e monetárias internacionais e análise de esta- 
tísticas económicas. 


e 0 Dr. Joseph Daly, estatístico matemático chefe, Office of the Assistant Director for 
Statistical Standards, Bureau of the Census dos Estados Unidos, chegou ao Rio de 
Janeiro, em novembro de 1959, com a breve incumbéncia de entender-se com várias 
reparticóes governamentais brasileiras sóbre a conveniéncia de instalar e utilizar cal- 
culadores eletrónicos para a apuracáo do Recenseamento Geral de 1960 e outros progra- 
mas estatísticos. 


CANADA 


Recent statistical publications Publicaciones estadísticas recientes 


eo The Health and Welfare Division of e 


the Dominion Bureau of Statistics (DBS) la 
(1) Tuber- 
Trends, 1958 is a 6-page report 
showing the trend of tuberculosis in recent 
years in terms of incidence, hospitalization, Ad ea , Ma 
; : , E pia términos de incidencia, hospitalización y 
and mortality. It contains an abstract of ' A , ¿ 
U e lts 1 8 eii mortalidad. Contiene un resumen de datos 
re basic data from the more detaile« Es , 8 

; ield ds e ; básicos de los informes más detallados en 
reports in each field. (2) Poliomyelitis cada campo. (2) Poliomyelitis Trends, 
Tre 052 ¡e -NIOP ati : » 5% ' ea , 
Prends, 1958 is an 8-page bulletin issued /958, es un boletín de 8 páginas publicado 


La División de Salud y Bienestar de 
Dirección de Estadística del Dominio 
(DBS) ha publicado dos nuevos informes: 
(1) Tuberculosis Trends, 1958, es un bo- 
letín de 6 páginas que muestra la tendencia 
de la tuberculosis en los años recientes en 


has released two new reports: 
culosis 


early during the poliomyelitis year to sup- 


ply health workers with a background 
against which to measure the current 
incidence data. Either publication may be 


purchased at $0.25 (Can.) each. 


e A new bilingual report has been issued 
by the Education DBS 
under the title, Survey of Libraries, 
1957-1958 — Relevé des Bibliothéques, 
1957-1958. 1t presents statistics on urban 
libraries in centres of 10,000 and 


Division of the 


over, 


al comienzo de la campaña anual polio- 
mielítica, para suministrar trabajadores en 
salud pública con antecedentes listos para 
usar en la medición de los datos actuales 
sobre incidencia. Puede adquirirse cual- 
quiera de las dos publicaciones a 5$0,25 
(Can.) cada una. 


e La División de Educación del DBS ha 
publicado un nuevo informe bilingúe bajo 
el título, Survey of Libraries, 1957-1958 — 
Relevé des Bibliothéques, 1957-1958, Pre- 
senta estadísticas sobíe bibliotecas urbanas 
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regional, co-operative, travelling and open- 
-shelf libraries, and on university and col- 
lege libraries. The publication is available 
at $0.75 (Can.) DBS or the 
Department of Public Printing and Sta- 
tionery, Ottawa, Canada. C.C. 


Lingard, DBS, Ottawa, December 1959.) 


from the 


(Sources: 


Personal notes 


e In August 1959, Mr. J.T. Marshall, 


assistant 


853 


en centros de 10.000 y más habitantes, re- 
gionales, cooperativas, circulantes y “abier- 
tas” (open-shelf) y de bibliotecas de uni- 
versidades y colegios superiores. La publi- 
cación está disponible a $0.75 (Can.) en 
la DBS, o en el “Department of Public 
Printing and Stationery, Ottawa, Canada.” 
(Fuente: C.C. Lingard, DBS, Ottawa, di- 
ciembre 1959.) 


Dominion statistician, Mr. Leslie 


Forsyth, assistant director, Census Division, and Mr. William J. Moore, director, Special 


Surveys Division, Dominion Bureau of Statistics, participated in the Regional Field 


Directors” Conference at the United States Bureau of the Census, Washington, D.C. 


CHILE 


CIEF graduation, 1959 


e On December 14, 1959, the closing 
ceremony held for the seventh year 
of operation of the Inter-American Train- 
ing Center for Economic and Financial 
Statistics (CIEF). Twenty-seven students 
from 17 countries finished the complete 
course and 34 students took only selected 
subjects in the course. Certificates for 
completion of the course were awarded to: 
Miguel Angel Almada and Adolfo Busca- 
glia, ARGENTINA; Enrique  Alandia, 
BOLIVIA; A. Taumaturgo Nogueira, BRA- 
71L; Rubén Cárdenas Seguel, Ninfa 
Crespo Moya, and Adolfo Goldenstein K., 
CHILE; Luis E. López Osorio, COLOM- 
BIA; Carlos Formoso Herrera, COSTA 
RICA; Rodrigo Santamaría V. and Aníbal 
Soto Casares, ECUADOR; René Calderón 
Guillén, Manuel Salvador López O., and 
Raúl Rodríguez Arango, GUATEMALA; 
Ernest P. Casseus, HAITI; José Vicente 
Díaz and Gustavo Fú Peñalba, HONDU- 
RAS; Romeo Madrigal Hinojosa, Rafael 
Serna Treviño, and Raúl de la Sota Riva, 
MEXICO; Edilma E. Maitín, PANAMA; 
Luciano Larriel, PARAGUAY; Reynaldo 
Franco Cosquillo, PERU; Sixto 1. Antivero, 
Alfredo Massó Martínez, Alberto Pinto 
Aponte, and Tulio Vásquez Díaz, VENE- 
ZUELA. (Source: Raúl Conde, CIEF, San- 
tiago, December 1959.) 


was 


Graduación en el CIEF, 1959 


e El 14 de diciembre, 1959, se realizó la 
ceremonia de clausura del séptimo año de 
funcionamiento del Centro Interamericano 
de Enseñanza de Estadística Económica y 
Financiera (CIEF). Veintisiete estudiantes 
de 17 países terminaron el curso completo 
y 34 estudiantes asistieron a cursos de es- 
pecialización. Certificados de terminación 
del curso fueron entregados a: Miguel 
Angel Almada y Adolfo Buscaglia, ARGEN- 
FINA; Enrique Alandia, BOLIVIA; A. 
Taumaturgo Nogueira, BRASIL; Rubén 
Cárdenas Seguel, Ninfa Crespo Moya, y 
Adolfo Goldenstein K., CHILE; Luis E. 
López Osorio, COLOMBIA; Carlos For- 
moso Herrera, COSTA RICA; Rodrigo 
Santamaría V. y Aníbal Soto Casares, 
ECUADOR; René Calderón Guillén, Ma- 
nuel Salvador López O. y Raúl Rodríguez 
Arango, GUATEMALA; Ernest P. Casseus, 
HAITI; José Vicente Díaz y Gustavo Fú 
Peñalba, HONDURAS; Romeo Madrigal 
Hinojosa, Rafael Serna Treviño, y Raúl de 
la Sota Riva, MEXICO; Edilma E. Maitín, 
PANAMA; Luciano Larriel, PARAGUAY; 
Reynaldo Franco Cosquillo, PERU; Sixto 
I. Antivero, Alfredo Massó Martínez, Al- 
berto Pinto Aponte, y Tulio Vásquez Díaz, 
VENEZUELA. (Fuente: Raúl Conde, 
CIEF, Santiago, diciembre 1959.) 
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COLOMBIA 


Elemental course on statistics 


e In August 1959, the National Admin- 
istrative Department of Statistics (DANE) 
of Colombia, initiated a series of short 
courses on statistics so that all the person- 
nel of the branch offices could be 
technically trained for the execution of 
their duties. Each course is to last two and 
a half months and is to cover a review 
of the basic elements of mathematics, sta- 
tistical concepts, statistical problems and 
applications, organization of the DANE, 
statistical tables, graphic presentation of 
frequency distribution and chronological 
series, summary of the statistical process, 
most used averages and methods of 
calculating, relative mumbers, percentages 
and indexes, and use of adding 
valculating machines. 


and 


Sixteen persons satisfactorily completed 
the first course. Once the DANE person- 
nel has received basic preparation, more 
extensive statistical courses will be initiated, 
to which employees of other government 
agencies will be invited. Alberto 
Charry Lara, DANE, November 
1959.) 


(Source: 
Bogotá, 


Noticias personales 


Cursillo elemental de estadística 


e En el Departamento Administrativo 
Nacional de Estadística (DANE) se incia- 
ron el 4 de agosto de 1959 una serie de 
cursillos de estadística con el objeto de 
que todo el personal de sus dependencias 
estén capacitados técnicamente para el de- 
sarrollo de sus funciones. La duración de 
cada uno de estos cursillos es de dos meses 
v medio y en ellos se enseñan las siguien- 
tes nociones básicas: repaso de los conoci- 
mientos necesarios de matemáticas, con- 
cepto de estadística, problemas y aplica- 
ciones de la estadística, la organización del 
DANE, tablas estadísticas, representación 
gráfica de las distribuciones de frecuencia 
y de las series cronológicas, síntesis del 
proceso estadístico, promedios más usados 
y sus métodos de cálculo, números relati- 
vos (porcentajes e índices), uso de máqui- 
nas de sumar y de calcular. 

Diez y seis personas completaron satis- 
factoriamente el primer curso. Cuando el 
personal del DANE haya recibido prepa- 
ración básica, se iniciarán cursos más ex- 
tensos de estadística, a los cuales serán in- 
vitados funcionarios de otras dependencias 
del gobierno. (Fuente: Alberto Charry 
Lara, DANE, Bogotá, noviembre 1959.) 


e El Sr. Benllini Galindo, economista, Banco de la República de Colombia, Bogotá, 
se encuentra en Washington, D.C., por un período de un año, desde septiembre de 


1959, asistiendo al curso de entrenamiento en técnicas monetarias y financieras interna- 


cionales, y análisis de estadísticas 


Internacional. 


económicas, 


que auspicia el Banco Monetario 


COSTA RICA 


Reorganization of statistical 
course 


e As a result of the reorganization of 
the statistical course in the School of 
Economic and Social Sciences of the 
University of Costa Rica, the following 
plan of studies will be initiated as of 1960: 
First year: Language; introduction to 
biology and sociology; history of culture; 
principles of philosophy and economics; 


Reorganización de la carrera 
estadística 


e El siguiente plan de estudios, resultado 
de la reorganización de la carrera Estadís- 
tica en la Escuela de Ciencias Económicas 
y Sociales de la Universidad de Costa Rica, 
comenzará a regir desde 1960: Primer año: 
Lengua materna; introducción a la biolo- 
gía; historia de la cultura; fundamentos de 
filosofía; introducción a la sociología; prin- 
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history of Costa Rican Institutions. Second 
year: Superv ised studies; general principles 
of insurance; economic general 
economic and social history; general math- 
ematics and calculus 1; general statistics; 
elemental accounting; principles of admin- 
istration. Third year: Calculus Il; sta- 
tistics and mathematics for economists; 
national income I; national income 1l; 
financial mathematics; public administra- 
tion; money, credit, and banking. Fourth 
year: Demographic statistics; statistical 
methods for investigators; statistical theory 
I; economic analysis; public finance and 
fiscal policy; economic doctrines. Fifth 
year: Design of experiments; design of 
surveys 1; design of surveys Il; statistical 
theory 11; 
modern 


theory; 


introduction to economics; 
economics. (Source: General 
Bureau of Statistics and Censuses, San José, 
November 1959.) 


Census budget and cost guide 


e In March of 1959, a Central American 
Seminar on Census Administration was 
held in San José, Costa Rica, under the 
sponsorship of the Central American 
Advanced School of Public Administration 
(ESAPAC) in collaboration with the United 
Nations. As a result of one of the con- 
clusions of the Seminar, Dr. Benedicto 
Caplán, ESAPAC professor of public 
finance, prepared a guide for the estimation 
and control of census costs under the title, 
Guía para Presupuesto y Cálculo de Costos 
de los Censos (Economic and Financial 
Series No. 7, San José, November 1959, 
42 p.). 

"The publication is divided into four 
chapters: General principles of budget and 
census costs, classification of census ex- 
penses, assignment of expenses, and observa- 
tions on the experience in some countries. 
(Sources: Wilburg Jiménez Castro, General 
Bureau of Statistics and Censuses, 
José, November 1959; the 
mentioned.) 


San 
publication 


Other recent statistical publications 


e A text summarizing the lessons on 
methodological statistics given in the Il 
Central American Course in Statistics (11 
CCFE) has been prepared by Roberto Sasso 
and published in 1959 by the Institute of 


cipios de economía; historia de las institu- 
ciones de Costa Rica. Segundo año: Estu- 
dios supervisados; principios generales de 
seguros; teoría económica; historia general 
económica y social; matemáticas generales 
y cálculo 1; estadística general; contabili- 
dad elemental; principios de alministra- 
ción. Tercer año: Cálculo 1l; estadística 
y matemáticas para economistas; contabi- 
lidad social 1 (ingreso nacional); contabi- 
lidad social II (ingreso nacional); mate- 
máticas financieras; administración pública; 
moneda, crédito y banco. Cuarto año: Es- 
tadística demográfica; métodos estadísticos 
para investigadores; teoría estadística 1; 
análisis económico; fimanzas públicas y 
política fiscal; doctrinas económicas. Quin- 
to año: Diseño de experimentos; diseño de 
encuestas l; diseño de encuestas 11; teoría 
estadística II; introducción a la economía; 
economía moderna. (Fuente: Dirección 
General de Estadística y Censos, San José, 
noviembre 1959.) 


Guía para presupuesto y 
costos censales 


e En marzo de 1959 tuvo lugar en San 
José, Costa Rica, el Seminario Centroame- 
ricano de Administración Censal, auspicia- 
do por la Escuela Superior de Administra- 
ción Pública de América Central (ESAPAC) 
en colaboración con las Naciones Unidas. 
Como resultado de una de las conclusiones 
del Seminario, el Dr. Benedicto Caplán, 
profesor de finanzas públicas en ESAPAC, 
preparó un trabajo titulado, 
Presupuesto y Cálculo de de los 
(Serie: Economía y Finanzas No. 7, 
San José, noviembre de 1959, 42 p.). 

La publicación está dividida en cuatro 
capítulos: Principios generales de presu- 
puesto y costos censales, clasificación de 
gastos censales, imputación de gastos y ob- 
servaciones sobre la experiencia en algunos 
países. (Fuentes: Wilburg Jiménez Castro, 
Dirección General de Estadística y Censos, 
San José, noviembre 1959; la publicación 
mencionada.) 


Guía para 


Costos 
Censos 


Otras publicaciones 
estadísticas recientes 


e Un texto que resume las lecciones so- 
bre estadística metodológica, dictadas en 
el 1 Curso Centroamericano de Formación 
Básica en Estadística (11 CCFE), fue pre- 
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Statistics of the University of Costa Rica. 
It is entitled Introducción a la Estadística 
(228 p.). 


e Final results of the 1955 Agricultural 
Census were released by the General Bureau 
of Statistics and Censuses (DGEC) in 1959 
under the title, Censo Agropecuario de 
1955 (387 p.) (see IASI Estadística No. 
59-60, p. 365, for note on the publication 
of advance results of this census obtained 
by sampling). This is the first census 
taken under the Statistical Law of 1953 
which provides that Agricultural Censuses 
be taken every five years. 


e Information on the economic and social 
characteristics of the country has been 
published by the DGEC as Areas Demo- 
gráficas de Costa Rica (1959, 53 p.). The 
data are presented in tables and illustrated 
on maps and charts for the five areas into 
which the country was divided for this 
(Sources: DGEC, San José, No- 
vember 1959; the publications mentioned.) 


purpose. 


Noticias personales 


e En la Dirección General de Estadística 
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parado por el Prof. Roberto Sasso y pu- 
blicado en 1959 por el Instituto de Esta- 
dística de la Universidad de Costa Rica. 
Se titula Introducción a la Estadística 
(228 p.) 


e Los resultados finales del Censo Agro- 
pecuario de 1955, levantado por la Direc- 
ción General de Estadística y Censos 
(DGEC), fueron publicados en 1959 bajo 
el título de Censo Agropecuario de 1955 
(387 p.) (ver IASI Estadística No. 59-60, 
p. 365 nota sobre la publicación de resul- 
tados previos obtenidos por muestreo). 
Este es el primer censo realizado bajo la 
Ley Estadística de 1953 que dispone que 
el Censo Agropecuario se levante cada 
cinco anos. 


e Han sido publicadas, por la DGEC, bajo 
el título Areas Demográficas de Costa Rica 
(1959, 53 p.) informaciones sobre las ca- 
racterísticas económicas y sociales del país. 
Los datos se presentan en cuadros y están 
ilustrados con mapas y gráficos de las 
cinco áreas en las que fue dividido el país 
para este estudio. (Fuentes: DGEC, San 
José, noviembre 1959; la publicación men- 
cionada.) 


y Censos se hicieron las siguientes designa- 


ciones: Sra. Magda White de López, jefe, Sección de Transportes; Sra. Rosa Severino 


de Jiménez, jefe, Sección de Información. 


e El Sr. Fernando Martén Rodríguez, jefe, Servicios Mecanizados, Oficina Técnica 
Mecanizada, Ministerio de Economía y Hacienda, San José, llegó a Washington, D.C., 


en octubre de 1959, para seguir un curso de entrenamiento de cuatro meses en operaciones 


y estadísticas aduaneras en el Bureau of the Census, con beca otorgada por la International 


Cooperation Administration. 


Noticia personal 


eo El Sr. Isidro C. 


Medina Pelayo, economista, Sección de Economía Internacional y 


Balanza de Pagos, Banco Nacional de Cuba, Habana, llegó a Washington, D.C., en 


septiembre de 1959, por un período de entrenamiento de seis meses en técnicas monetarias 


y financieras internacionales, análisis de 


estadísticas económicas, y metodología de 


balanza de pagos, becado por el Banco Monetario Internacional. 
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ECUADOR 


Recent statistical activities 


e Special censuses were taken on build- 
ings, housing, and population in the 
cantonal capitals of the Province of Pi- 
chincha: Cayambo, Sangolquí, Tabacundo, 
and Machachi. At the same time special 
censuses of buildings and housing only 
were taken in 47 parochial capitals of the 
cantons mentioned. 


e Currently an experimental Industrial 
Survey is being taken in the Province of 
Pichincha. Depending upon the results 
obtained, the survey will be taken 
throughout the Republic. This work is 
under the direction of the National Board 
of Economic Planning and Coordination. 


eo A summer course for the technical 
preparation of statistical personnel was 
given by the Nucleus of Statisticians of 
Ecuador from August to October 1959. It 
was attended by employees of the various 
administrative branches. 


e The following publications have been 


released during the third quarter of 1959: 


Anuario de Comercio Exterior, 1958, 
published by the Fiscal Statistics Section 
of the Bureau of the Budget, Ministry of 
the Treasury; Estadísticas Sociales y del 
Trabajo, No. 62-73, published by the 
Economic and Labor Statistics Section of 
the General Bureau of Statistics and 
Censuses (DGEC); Boletín del Banco Cen- 
tral del Ecuador, No. 380-383, published 
by the Department of Economic Research 
of the Central Bank; Síntesis Estadística 
del Ecuador, Años 1955 a 1958 (22 p.), 
published in 1959 as an annex to the 
Report of the Ministry of Economy. The 
first 12 pages summarize, in tabular form, 
national data on population, vital statistics, 
employment, agriculture, industry and 
mining, construction, electric power energy, 
transportation, communication, 
trade, balance of payments, prices and 
salaries, national income and product, 
money and banking, public finance, private 
finance, social statistics, education, and 
hospitals. In the commentary following 
the tables it is pointed out that much of 
the 1958 data are preliminary and will be 
adjusted in  subsequent publications. 
(Sources: Fabián Suárez Benítez, DGEC, 
Quito, November 1959; Síntesis Estadís- 
tica ...) 


foreign 


Actividades estadísticas recientes 


e Se efectuaron censos especiales de Edi- 
ficios, Viviendas y Población en las cabe- 
ceras cantonales de la Provincia de Pi- 
chincha: Cayambo, Sangolquí, Tabacundo 
y Machachi y, al mismo tiempo, sólo de 
Edificios y Viviendas en las 47 cabeceras 
parroquiales de los Cantones indicados. 


e En la actualidad se está llevando a cabo 
una Encuesta Industrial de prueba en la 
Provincia del Pichincha y de acuerdo a 
los resultados que se logren, se realizará 
en toda la República. Esta tarea está bajo 
la dirección de la Junta Nacional de Pla- 
nificación y Coordinación Económica, 


eo El Núcleo de Estadísticos del Ecuador 
dictó un curso de verano, para la prepa- 
ración técnica del personal estadístico, 
desde agosto hasta octubre de 1959, al que 
asistieron empleados y funcionarios de 1:s 
diferentes dependencias administrativas. 


e Durante el tercer trimestre de 1959 
fueron puestas en circulación las siguientes 
publicaciones: Anuario de Comercio Exte 
rior, 1958, editado por la Sección de Esta- 
dística Fiscal de la Dirección de Presupues- 
to del Ministerio de Finanzas; Estadísticas 
Sociales y del Trabajo, No. 62-73, editadas 
por la Sección de Estadísticas Económicas 
y del Trabajo de la Dirección General de 
Estadística y Censos (DGEC); Boletín del 
Banco Central del Ecuador, No. 380-383, 
editado por el Departamento de Investiga- 
ciones Económicas del Banco Central; 
Sintesis Estadística del Ecuador, Años 1955 
a 1958 (22 p.), publicada en 1959 como 
anexo al Informe del Ministro de Econo- 
mía. Las 12 primeras páginas resumen, en 
forma tabular, datos nacionales sobre po- 
blación, estadísticas vitales, empleo, agri- 
cultura, industria y minería, construcción, 
electricidad, energía, transportes, comuni- 
caciones, comercio exterior, balanza de pa- 
gos, precios y salarios, ingreso y producto 
nacional, moneda y bancos, finanzas públi- 
cas, finanzas privadas, estadísticas sociales, 
educación, y hospitales. En los comenta- 
rios que siguen a los cuadros se destaca 
que muchos de los datos de 1958 son pre- 
liminares y serán ajustados en publicacio- 
nes posteriores. (Fuentes: Fabián Suárez 
Benítez, DGEC, Quito, noviembre 1959; 
Síntesis Estadística ...) 
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e ElSr. Rubén Darío Endara, jefe, División de Importación, Banco Central del Ecuador, 
Quito, llegó a Washington, D.C., en septiembre de 1959, por un período de un año, 
becado por el Banco Monetario Internacional, para seguir un curso de entrenamiento en 
técnicas monetarias y financieras internacionales, análisis de estadísticas económicas, y 


metodología de balanza de pagos. 


EL SALVADOR 


Inquiries for measuring 
the level of unemployment 


e In September 1959, the General Bureau 
of Statistics and Censuses (DGEC) con- 
ducted two inquiries—one to investigate 
economic characteristics, and the other 
socio-economic characteristics—the purpose 
of them being to measure the level of 
unemployment prevalent in a certain sector 
of the population of the municipality of 
San Salvador. 

For economic reasons, the data were 
collected by the self-enumeration method, 
in which all employees in government of- 
fices as well students in public schools and 
public kindergartens residing with their 
families in the area participated. 

Two types of schedules were used, each 
of which contained similar sections for 
noting information on employment and 
unemployment relating to the persons 
investigated. The information required 
therein was as follows: (1) Name of the 
person; (2) relationship to the government 
employee or student, as the case may be; 
(3) profession, occupation or trade; (4) 
whether the person worked during the 
period in question, and (5) if the person 
did not work and did not look for work, 
the reason. For the last three questions a 
reference period of 13 days, between 
September 14 and 26, 1959, was indicated. 
There was an additional question, inquir- 
ing as to the total time that a person 
(employed or unemployed) was without 
work during the period January 1 to 
September 20, 1959. In the schedule used 
for students another section was added in 
order to obtain information especially for 
the Ministry of Popular Culture. Source: 
Octavio Bracamonte, DGEC, San Salvador, 
November 1959.) 


Encuestas para medir el 
grado de desempleo 


e En el mes de septiembre de 1959 la 
Dirección General de Estadística y Censos 
(DGEC) llevó a cabo dos encuestas desig- 
nadas: (1) Investigación sobre característi- 
cas económicas y (2) Investigación socio- 
económica, cuyos objetivos fueron medir el 
grado de desempleo existente en determi- 
nado sector de la población del municipio 
de San Salvador. 

Por razones de orden económico, la re- 
colección de los datos se llevó a cabo por 
el sistema del autoempadronamiento y se 
contó con la colaboración de todos los m- 
pleados en oficinas del gobierno y estu- 
diantes en escuelas y jardines de infantes 
oficiales que residen con sus familias en 
dicha área. 

Se utilizaron dos clases de formularios, 
conteniendo ambos una sección similar 
donde se anotó información sobre empleo 
y desempleo relativa a las personas inves- 
tigadas. La información requerida en dicha 
sección fue la siguiente: (1) Nombre de la 
persona; (2) relación o parentesco con el 
empleado de gobierno o estudiante, según 
el caso; (3) profesión, ocupación u oficio; 
(4) trabajó durante el período? y (5) si 
no trabajó y no buscó trabajo, cuál fue 
el motivo ?. Para las tres últimas pregun- 
tas indicadas se señaló un período de re- 
ferencia de 13 días, comprendido entre el 
14 y el 26 de septiembre de 1959. Hubo 
otra pregunta adicional, mediante la cual 
se trató de investigar el tiempo total que 
una persona (ocupada o desocupada) es- 
tuvo sin trabajo en el período comprendido 
entre el 1 de enero y el 20 de septiembre 
de 1959. En el formulario usado para es- 
tudiantes se dispuso además de otra sección 
en la cual se obtuvo información que ser- 
virá especialmente al Ministerio de Cultura 
Popular. (Fuente: Octavio Bracamonte, 
DGEC, San Salvador, noviembre 1959.) 
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Noticias personales 


e En la Dirección General de Estadística y Censos (DGEC) se hicieron los siguientes 
nombramientos: Sr. Miguel Angel Hernández, secretario general; Srta. Concepción Cañas, 
jefe, Punto Focal Nacional; y Sr. Octavio Bracamonte, jefe, Sección Estadísticas Culturales 
y Judiciales. 

e La Srta. María I. Angulo, oficial de primera clase, DGEC, San Salvador, se encuentra 
en Washington, D.C., desde julio de 1959, por un período de nueve meses de entre- 


namiento en organización y 


administración 


censal, becada por la International 


Cooperation Administration y por el Bureau of the Census (E.U.A.). 


GUATEMALA 


Agricultural surveys 


e During the week of September 20-26, 
1959, the Second Agricultural Survey of 
1959 was taken throughout the country by 
the General Bureau of Statistics (DGE). 
Information was collected for the purpose 
of forecasting the production of selected 
agricultural items during the agricultural 
year 1959-60. 

e Results of the First Agricultural Survey 
of 1959, to obtain agricultural production 
estimates for the year 1958-59, are now 
being '2bulated in the Agricultural Sta- 
tistics Section of the DGE. (Source: René 
Arturo Orellana G., DGE, Guatemala, 
October 1959.) 


Recent statistical publications 


e The General Bureau of Statistics (DGE) 
has released the fourth issue of Guatemala 
en Cifras, an annual publication designer 
to present summary data on economic and 
social conditions in Guatemala. This issue 
covers 1958. 

e Also published by the DGE is the 
Anuario Estadístico de Comercio Exterior, 
1958 (1959, 242 p.), a special publication 
on the foreign trade of the country, with 
data on the import and export of com- 
modities and on the trade balance for 1958. 
This is the first time the yearbook presents 
information prepared completely from 
mechanical tabulations. (Sources: René 
Arturo Orellana G., DGE, Guatemala, 
October 1959; Anuario . . .) 


Noticias personales 


Encuestas agrícolas 


e Durante la semana del 20 al 26 de 
septiembre, 1959, se realizó en el país la 
Segunda Encuesta Agrícola de 1959, con- 
ducida por la Dirección General de Esta- 
dística (DGE). Se recolectó información 
para pronosticar la producción de artículos 
agrícolas seleccionados durante el año 
agrícola 1959-1960. 

e Los resultados de la Primer Encuesta 
Agrícola de 1959 para obtener estimaciones 
de la producción para el año 1958-1959, 
están ahora tabulándose en la Sección de 
Estadísticas Agrícolas de la DGE. (Fuente: 
René Arturo Orellana G., DGE, Guate- 
mala, octubre 1959.) 


Publicaciones estadísticas recientes 


eo La Dirección General de Estadística 
(D'SE) ha puesto en circulación la cuarta 
edición de Guatemala en Cifras, publica- 
ción ¿mual diseñada para presentar datos 
sumarios sobre las condiciones económica 
y social en Guatemala. Esta edición corres- 
ponde a 1958. 

eo El Anuario Estadístico de Comercio 
Exterior, 1958 (1959, 242 p.) es una pu- 
blicación especial editada por la DGE so- 
bre el comercio exterior del país, que con- 
tiene datos sobre la importación y expor- 
tación de mercaderías y sobre la balanza 
comercial de 1958. Esta es la primera vez 
que el anuario presenta información pre- 
parada completamente por tabulación me- 
cánica. (Fuentes: René Arturo Orellana 
G., DGE, Guatemala, octubre 1959; 
Anuario...) 


e El Lic. Francisco López Granados fue designado director general, Dirección General 


de Estadística, Guate.xmaja, en noviembre de 1959. 
último 


nombramientos en la DGE durante el 


También se efectuaron los siguientes 
trimestre del mismo año: Juan José 
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Quiñonez Vargas, inspector general; Osberto Graj:da Robles, jefe del Departamento 
de Máquinas; José Victor Morales Archila, secretario general; y Federico Maldonado 


López, jefe de personal. 


e El Sr. Mario René Gómez Valencia, oficial, Sección de Cambio Extranjero, Banco 
de Guatemala, se encuentra en Washington, D.C., desde septiembre de 1959, becado 
por el Banco Monetario Internacional, siguiendo un curso de entrenamiento en técnicas 
monetarias y financieras internacionales, y análisis de estadísticas económicas. 


HONDURAS 


Noticia personal 


e El Sr. M.M. Babbar (India), técnico en estadísticas agrícolas de la Organización de 
las Naciones Unidas para la Agricultura y la Alimentación, visitó Tegucigalpa, en 
noviembre de 1959, con el propósito de prestar asistencia técnica directa a la Dirección 


General de Estadística y Censos. 


MÉXICO 


Experimental Censuses of 
Population and Agriculture 


e By order of the President of the 
Republic of Mexico and an auxiliary decree 
issued by the Governor of the State of 
Mexico, Experimental Censuses of Popula- 
tion and Agriculture, were taken in the 
municipio of Ixtapaluca. The population 
census was taken August 26, 1959, and the 
agricultural census from August 10 to 
September 8 of the same year. 

The primary objective of these censuses 
was to try out the preliminary question- 
naires which are planned for use in the 
coming National Censuses of 1960. In 
general the results were satisfactory and 
it was ascertained that the municipio 
contained 17,894 inhabitants, 800 farms 
comprising 17,789 hectares, and 8 communal 
farms comprising 13,702 hectares. In 
comparing these results with those of the 
1950 Census, it is noted that there is an 
increase of 65 percent in the number of 
inhabitants and a total increase of 22.7 
percent of area enumerated. 

The direct method of interview was used 
in the investigation. Cooperating in the 
undertaking were employees of the General 
Bureau of Statistics (DGE) and of other 
government ministries and agencies and 
teachers of the municipio. The editing 
and tabulating of the data was done in 
the offices of the DGE. (Source: Jacinto 
Rodríguez Mateos, DGE, Mexico, Novem- 
ber 1959.) 


Censos Experimentales de 
Población y Agropecuarios 


e Por orden del Presidente de la Repú- 
blica de México y un decreto auxiliar emi- 
tido por el Gobernador del Estado de Mé- 
xico, se levantaron Censos Experimentales 
de Población y Agropecuarios en el mu- 
nicipio de Ixtapaluca. El censo experi- 
mental de población fue levantado el 26 
de agosto de 1959, y los censos agropecua- 
rios desde el 10 de agosto al 8 de septiembre 
del mismo año. 

El objeto principal de estos censos fue 
el de poner a prueba los anteproyectos de 
cuestionarios en que se basarán los próxi- 
mos censos nacionales de 1960. Los resul- 
tados obtenidos fueron, en general, satis- 
factorios y se constató que el municipio 
tiene 17.894 habitantes, 800 fincas con 
17.789 hectáreas, y 8 ejidos con 13.702 
hectáreas. Comparando estos resultados con 
los del Censo de 1950, se constata un in- 
cremento de 65 por ciento en el número 
de habitantes y un aumento total del 22,7 
porciento en la superfície total censada. 

La investigación fue realizada por el 
método directo. Cooperaron en ella em- 
pleados de la Dirección General de Esta- 
dística (DGE) y de otras Secretarías de 
Estado y autoridades y maestros del mu- 
nicipio. La crítica y tabulación de los da- 
tos se realizaron en las oficinas de la DGE. 
(Fuente: Jacinto Rodríguez Mateos, DGE, 
México, noviembre 1959.) 
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Technical census council 


e In accordance with Presidential Resolu- 
tion of July 22, 1959, the Technical Council 
of the National Census of 1960 was created, 
constituted by the following: Chairman, 
Mr. Raúl Salinas Lozano (Secretary of 
Industry and Commerce); advisers: Messrs. 
Gilberto Loyo, Juan de Dios Bojórquez, 
and Emilio Alanís Patiño; executive repre- 
sentative: Mr. Albino Zertuche (director 
general of statistics). (Source: Jacinto Ro- 
dríguez Mateos, DGE, Mexico, Novembe1 
1959.) 


Recent statistical publications 


e Data are now available in three volumes 
on the VI Industrial Census taken in Me- 
xico in 1956 to cover industrial operation 
during 1955. The volumes are published 
by the General Bureau of Statistics (DGE) 
as Censo Industrial, 1956 (Información 
Censal 1955), Resumen General. The data 
refer to all establishments of the country 
regardless of their respective value of 
production and are presented in seven 
basic tables on the principal characteristics 
of the most important industrial classes by 
divisions, groups, and subgroups and by 
major political divisions and principal 
municipios. 


e Comparative agricultural data for three 
census years have been published by the 
DGE as Censos Agropecuarios 1930, 1940 y 
1950 (1959, 61 p.). The volume comprises 
three parts: The first covers national totals 
on agriculture and livestock obtained in 
the three censuses. The second part pre- 
sents data for Federative Major Political 
Divisions as well as for each Agricultural 
Economic District (units composed of one 
or more political divisions). The third 
gives figures for the five principal products 
of each State or Territory of the country. 
At the end of the publication there is a 
map of the country with divisions by the 
Agricultural Economic Districts existing in 
1950. 


e A statistical vearbook of fishing activities 


in Mexican territorial waters has been 
published under the title, Anuario Estadís- 
tico de Actividades Pesqueras en Aguas 
Territoriales Mexicanas (1957, 417 p.), by 
the General Bureau of Fishing. The 
vearbook contains statistical data on na- 
tional production of various marine species 


Consejo técnico censal 


e Por Acuerdo Presidencial, el 22 de ju- 
lio de 1959, se constituyó el Consejo Téc- 
nico de los Censos Nacionales de 1960, 
quedando integrado en la siguiente forma: 
Presidente, Lic. Raúl Salinas Lozano (Se- 
cretario de Industria y Comercio); conseje- 
ros: Lic. Gilberto Loyo, Ing. Juan de Dios 
Bojórquez e Ing. Emilio Alanís Patiño; 
vocal ejecutivo: Ing. Albino Zertuche (di- 
rector general de estadística). (Fuente: Ja- 
cinto Rodríguez Mateos, DGE, México, no- 
viembre 1959.) 


Publicaciones estadísticas recientes 


e Los datos del VI Censo Industrial, le- 
vantado en México en 1956 para cubrir las 
operaciones industriales de 1955, fueron 
publicados en tres volúmenes por la Di- 
rección General de Estadística (DGE) bajo 
el título Censo Industrial, 1956 (Informa- 
ción Censal 1955), Resumen General. Los 
datos se refieren a todos los establecimien- 
tos del país, no importando el monto del 
valor de la producción de cada estableci- 
miento, y están presentados en siete cua- 
dros básicos según las características indus- 
triales más importantes clasificadas por di- 
visiones, grupos subgrupos y según las 
principales divisiones políticas y municipios. 


e Datos comparativos de las cifras de tres 
censos agropecuarios han sido publicados 
por la DGE como Censos Agropecuarios 
1930, 1940 y 1950 (1959, 61 p.). El volumen 
comprende tres partes: La primera rela- 
cionada con los datos nacionales obtenidos, 
en cada uno de los tres censos, en agricul- 
tura y ganadería. La segunda presenta los 
datos según las divisiones políticas federa- 
les mayores como también para cada Dis- 
trito Económico Agrícola (unidades com- 
puestas por una o más divisiones políticas). 
La tercera da cifras para los cinco produc- 
tos más importantes de cada Estado o Te- 
rritorio del país. Al final de la publicación 
hay un mapa del país con divisiones por 
Distritos Económico Agrícolas existentes 
en 1950. 


e Bajo el título, Anuario Estadístico de 
Actividades Pesqueras en Aguas Territoria- 
les Mexicanas (1957, 417 p.), la Dirección 
General de Pesca publicó cifras sobre la 
producción nacional en 1957, de las varias 
especies marinas por meses y principales 
divisiones políticas. 
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during 1957 by months and major political 
divisions. 


e The General Bureau of Fishing has 
also released a summary entitled, Resumen 
de Actividades Pesqueras, 1952-1957. 1t is 
a condensed pictorial presentation of fish- 
ing activities in general, shown in statistical 
tables and comparative graphs. (Sources: 
Jacinto Rodríguez Mateos, DGE, Me- 
xico, November 1959; the publications 
mentioned.) 
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e La Dirección General de Pesca dió a 
publicidad un sumario titulado Resumen 
de Actividades Pesqueras, 1952-1957. Es 
una presentación gráfica condensada de las 
actividades pesqueras en general, mostrando 
cuadros estadísticos y gráficos comparativos. 
(Fuentes: Jacinto Rodríguez Mateos, DGE, 
México, noviembre 1959; las publicaciones 


mencionadas.) 


Noticias personales 


e El Sr. Albino Zertuche, director general, Dirección General de Estadística (DGE), y 
dos de sus técnicos visitaron el Bureau of the Census de los Estados Unidos en julio 
de 1959, para estudiar el posible uso del proceso electrónico de recolección de datos 


en el censo de 1960. 
e La Srta. Ana María Flores, directora, Dirección General de Bioestadística y Biometría, 


México, fue elegida miembro titular del Instituto Internacional de Estadística en 
noviembre de 1959. 


NICARAGUA 


Noticias personales 


e El Sr. Miguel López Berrios, médico asistente, Segunda División, Ministerio de 
Salubridad Pública, Managua, fue becado por la Oficina Sanitaria Panamericana, para 


asistir a un curso de bioestadística en la Columbia University, a partir de septiembre 
de 1959. 


e El Sr. Luis Eduardo Miranda, asistente en economía agrícola, Servicio Técnico Agrí- 
cola Nacional, Ministerio de Agricultura, Managua, llegó a Washington, D.C., en agosto 
de 1959, para seguir un curso de entrenamiento de un año en estimaciones agrícolas 


y servicios estadísticos, con beca otorgada por la International Cooperation Administration 
y el Agricultural Marketing Service (E.U.A.). 


PANAMÁ 


Census tests 


e The plan of census preparations of the 
Bureau of Statistics and Census (DEC) 
included preliminary census tests, experi- 
mental censuses, and verification of the 
enumeration. The preliminary test related 
with the population census was carried out 
in June 1959 in urban and rural areas 
selected for this purpose. These areas 
comprised 10 rural segments (or enumera- 


Ensayos censales 


e El plan de ensayos censales de la Di- 
rección de Estadística y Censo (DEC) 
incluyó pruebas preliminares, censos expe- 
rimentales y verificación del empadrona- 
miento. La prueba preliminar relacionada 
con el censo de población se efectuó, en 
junio de 1959, en áreas urbanas y rurales 
seleccionadas para tal fin; dichas áreas 
abarcaron 10 segmentos (o áreas de empa- 
dronamiento) rurales y 11 segmentos ur- 
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tion areas) an 11 urban segments, located 
in different quarters of the city of Panama. 
The test mentioned had as its principal 
objective to find the best way to investigate 
internal migration and the economic 
characteristics of the population. 


The questionnaire used included ques- 
tions relative to: Sex, age, relationship to 
head of household, marital status, place 
of birth, level of education, occupation, 
branch of economic activity, type of oc- 
cupation, total duration of economic 
activities in the course of the previous year, 
and income (salary rate and type of pay- 
ment). The question on income was 
limited to the employed classified as wage 
earners. The section of the questionnaire 
concerned with internal migration covered 
the following questions: Since when are 
you living in this city, town, or village 
(month and year)? Where were you living 
before? Where were you living five years 
ago, i.e., in June of 1954? The definitions 
approved for the Program of the 1960 
Census of America (COTA-1960) and others 
of national interest which had been 
considered by the DEC Technical Commit- 
tee of the Censuses were applied. Observa- 
tions presented by the employees who 
participated in the test were of great help 
in the planning of the subsequent experi- 
mental census, as were the results of the 
tabulation made. 

Three months after this test, an experi- 
mental census on population and housing 


was carried out. The enumeration was 


made on two different dates. On Sunday, 
September 20, 1959, an urban area 
city of Aguadulce) and a rural area (the 
district of Capellanía) were enumerated; on 


(the 


Sunday, October 11, the 20  segments 


selected from different quarters of the city 
of Panama were enumerated. 


The experimental census 
purpose the testing ot: 
definitions 


had as its 
(1) concepts and 
recommended for the 1960 
Census of America and others of national 
interest, as well as the instructions for fil- 
ling out the schedule; (2) the type of 
schedule; (3) ehe organization of the 
enumeration; (4) use of the cartographic 
material; (5) time required by the enu- 
merator to fill out the schedule; (6) post- 
-enumeration vertification to measure the 
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banos, localizados en distintos barrios de la 
ciudad de Panamá. La prueba citada tuvo 
por objeto principal ensayar la forma más 
adecuada para investigar la migración in- 
terna y las características económicas de la 
población. 


El cuestionario usado comprendió pre- 
guntas relativas a: Sexo, edad, relación con 
el jefe del hogar censal, estado conyugal, 
lugar de nacimiento, nivel de educación, 
ocupación, rama de actividad económica, 
categoría de ocupación, duración total de 
las actividades económicas en el curso del 
año anterior, e ingreso (tasa de sueldo y 
tipo de pago). La pregunta sobre ingreso 
se limitó a los ocupados clasificados como 
empleados. La sección del cuestionario des- 
tinada a migración interna comprendió las 
siguientes preguntas: Desde cuándo vive 
usted en esta ciudad, pueblo o caserío (mes 
y año)? Dónde vivía usted antes? Dónde 
vivía usted hace cinco años, o sea en junio 
de 1954? Se aplicaron las definiciones re- 
comendadas por el Programa del Censo de 
América de 1960 (COTA-1960) y otras con- 
sideradas de interés nacional por el Comité 
Técnico de los Censos de la DEC. Las 
observaciones presentadas por los emplea- 
dos que participaron en la referida prueba 
fueron de gran ayuda para la planificación 
del cemso experimental subsiguiente. Lo 
mismo ocurrió en cuanto se refiere a las 
tabulaciones. 


Tres meses después de efectuada la 
prueba preliminar de población a que se 
ha hecho referencia se llevó a cabo el censo 
experimental que abarcó los campos de 
población y vivienda. El empadronamiento 
se efectuó en dos fechas distintas. El do- 
mingo 20 de septiembre se realizó el corres- 
pondiente a un área urbana (la ciudad de 
Aguadulce) y a un área rural (el Corregi- 
miento de Capellanía); el domingo 11 de 
octubre, el correspondiente a los 20 seg- 
mentos seleccionados en distintos 
de la ciudad de Panamá. 


barrios 


El censo experimental tuvo por objeto 
someter a prueba: (1) Conceptos y defini- 
ciones recomendados para el Censo de 
América de 1960 y otros de interés nacio- 
nal, así como las instrucciones para dili- 
genciar la boleta; (2) el tipo de boleta; 
(3) la organización «del empadronamiento; 
(4) el uso del material cartográfico; (5) 
tiempo requerido por el empadronador 
para diligenciar la boleta; (6) verificación 
posterior al empadronamiento para medir 
la integralidad y calidad del censo; (7) 
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completeness and quality of the census; 
(7) application of self-enumeration in the 
citv of Panama; (8) different procedures 
for the editing and coding of the data. 


As a preliminary step in the taking of 
the experimental census, the basic tabula- 
tion plans was prepared, covering popula- 
tion as well as housing. The plan included 
tabulation recommended for the 1960 
Census of America and some of national 
interest related with data on families and 
which presented difficulties in being 
processed in 1950. The schedule tested is 
of the columnar type, a design which has 
not been used before in Panama. This 
schedule included all the questions on 
population (except those refering to 
fertility) and housing which were asked in 
the 1950 census, with some variations, and 
included other new questions. 


census afforded an 
opportunity to measure the efficiency, 
although partiallv, of the decentralized 
organization recommended for the national 
censuses. In accordance with the DEC's 


The experimental 


information, the results obtained by self. 


-enumeration did not seem to warrant its 
use in the national census. Only 50 percent 
of the schedules distributed were filled out 
and of those only 67 percent were consider- 
ed fairly acceptable. 

There was a group of observers for the 
experimental census composed of employees 
of the DEC and of other departments of 
the General Comptrollership. Their duties 
were: To attend the training course for 
enumerators to notice anv deficiencies and 
suggest changes to correct them, to be 
present for 10 interviews during the enu- 
meration in order to observe any defi- 
ciencies on the part of the enumerator and 
the attitude of the informer. The observers 
recorded their comments on forms prepared 
for this purpose. 


Upon termination of the enumeration, 
and in accordance with the purposes of 
the experimental census, it was the duty 
of the zonal supervisors to do the editing 
and reviewing of the data, in order to 
avoid a verification later in the field. 


With respect to post-enumeration verifi- 


cation it should be pointed out that 


this was done to evaluate the extent to 
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aplicación del autoempadronamiento en 
la ciudad de Panamá; (8) distintos proce- 


dimientos para la crítica y codificación de 
los datos. 


Como paso preliminar al levantamiento 
del censo experimental se preparó el plan 
de tabulaciones básicas, tanto de población 
como de vivienda, que incluvó las reco- 
mendadas para el Censo de América de 1960 
y algunas de interés nacional relacionadas 
con datos sobre la familia y que presenta- 
ron dificultades para su elaboración en 
1950. La boleta ensayada es de tipo co- 
lumnar, diseño que no ha sido usado antes 
en Panamá y que incluye las preguntas en 
la primera columna, reservando cada una 
de las siguientes para un empadronado. 
Dicha boleta incluvó todas las preguntas 
de población y vivienda que formaron parte 
del Censo de 1950, con algunas variaciones; 
incluyó, además, otras preguntas nuevas. 


El censo experimental brindó una opor- 
tunidad para medir la eficiencia aunque 
parcialmente, de la organización descentra- 
lizada recomendada para los censos nacio- 
nales. De acuerdo con información de la 
DEC, los resultados obtenidos mediante el 
autoempadronamiento no aconsejan su 
uso en el censo nacional. Sólo el 50 por- 
ciento de las boletas repartidas fueron di- 
ligenciadas y de ellas sólo el 67 porciento 
se consideraron medianamente aceptables. 


Para el censo se dispuso de un grupo 
de observadores compuesto por empleados 
de la DEC y de otros departamentos de la 
Contraloría General. Sus funciones fueron 
las siguientes: Asistir a los cursos de adies- 
tramiento para observadores a fin de ano- 
tar cualquier deficiencia y sugerir cambios 
para subsanarlos y presenciar 10 entrevistas 
durante el empadronamiento con el objeto 
de tomar el tiempo, y observar las defi- 
ciencias del empadronador y la actitud del 
informante. En planillas preparadas para 
tal propósito los observadores hicieron las 
anotaciones requeridas. 

Terminado el empadronamiento, y de 
acuerdo con los fines del censo experimen- 
tal, correspondió a los inspectores censales 
de zona efectuar la crítica y revisión de 
los datos, para evitar una verificación pos- 
terior en el campo. 

Con respecto a la verificación posterior 
al empadronamiento cabe señalar que sus 
fines fueron evaluar la extensión con que 
el censo cubrió todas las viviendas y habi- 
tantes y evaluar la exactitud de las res- 
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which the census covered all the dwelling 
units and inhabitants and to evaluate the 
accuracy of the replies. This test was made 
by means of sampling. The sample used 
covered 20 percent of the segments and 
50 percent of the dwelling units located 
in the segments selected, which represents 
10 percent of all the dwelling units includ- 
ed in the experimental census. In order 
to determine the component elements of 
the sample, systematic selection was used. 
The regional inspector received a sealed 
envelope which contained the list of seg- 
ments and the indication, for each segment, 
as to whether to select schedules with even 
or uneven numbers. To verify completeness, 
the enumerator had to go over the whole 
segment to determine if all the dwelling 
units had been enumerated. To verify the 
quality of the data, he filled out a new 
schedule and a special form for additional 
information. In the test mentioned only 
those employees of the Population and 


Housing Section of the DEC participated. 
As to the editing of the data, two proce- 
dures were tried: In the first, the editing 


and coding were done simultaneously by 
one person, and in the second, the two 
tasks were done separately. In the latter 
case, the coding was done separately for 
each section of the schedule. (Source: 
Luisa E. Quesada, DEC, Panama, November 
1959.) 


Experimental Agricultural Census 


e During the first two weeks of October 
1959, an Experimental Agricultural Census 
was taken. The objectives of the Census 
were (1) to try out the basic schedules 
of the National Census (a basic schedule 
and an expanded schedule as well as a 
register of heads of household); (2) to test 
the instructions, the period of training of 
the field personnel, and the period of 
enumeration; (3) to try out procedures for 
verification of the enumeration; (4) to 
apply a simultaneous sampling to the 
Census; (5) to test processing procedures. 

The Census was carried out in an area 
of the District of Bugaba, Province of 
Chiriquí, since this location offers advan- 
tageous conditions for testing. The region 
selected comprises a total of 81 segments 
(enumeration sections) which include ap- 
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puestas. Esta prueba se hizo mediante 
muestreo. La muestra usada comprendió 
20 porciento de los segmentos y 50 por- 
ciento de las viviendas ubicadas en los 
segmentos seleccionados, lo que representa 
el 10 porciento del total de viviendas in- 
cluídas en el censo experimental. Para 
determinar los elementos componentes de 
la muestra se usó la selección sistemática. 
El inspector regional recibió un sobre 
sellado que contenía la relación de dichos 
segmentos y la indicación, para cada uno 
de ellos, de si se debían seleccionar las 
boletas cuyo número de orden era par o 
impar. Para verificar la completabilidad, 
el empadronador debía recorrer todo el 
segmento a fin de determinar si todas las 
viviendas habían sido empadronadas. Para 
verificar la calidad de los datos, él diligen- 
ciaba una nueva boleta para cada una de 
las incluídas en la muestra y un formulario 
especial que solicitaba informaciones adi- 
cionales. En esta prueba sólo participaron 
empleados de la Sección de Población y 
Vivienda de la DEC. En cuanto a la crí- 
tica de los datos se sometieron a prueba 
dos procedimientos: Según el primero se 
hacía la crítica y codificación de manera 
simultánea por una persona y, de acuerdo 
con el segundo, estas dos tareas se llevaron 
a cabo separadamente. En este último caso 
la codificación se hizo por separado para 
cada sección de la boleta. (Fuente: Luisa 
E. Quesada, DEC, Panamá, noviembre 
1959.) 


Censo Experimental Agropecuario 


e En la primera quincena de octubre se 
realizó el Censo Experimental Agropecua- 
rio. Los objetivos del Censo fueron (1) 
probar los formularios básicos del Censo 
Nacional (una boleta básica y otra am- 
pliada, así como un registro de jefes de 
viviendas); (2) probar las instrucciones, el 
período de adiestramiento del personal de 
campo y período de enumeración; (3) pro- 
bar los procedimientos para verificar la 
enumeración; (4) aplicar una muestra si- 
multánea al Censo; (5) ensayar los pro- 
cedimientos de elaboración. 


El Censo se efectuó en un área del Dis- 
trito de Bugaba, Provincia de Chiriquí, 
debido a que este lugar ofrecía condiciones 
ventajosas para el ensayo. La región se- 
leccionada comprendió un total de 81 seg- 
mentos (secciones de enumeración) que 
cubrieron alrededor de 2.000 viviendas y 
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proximately 2,000 dwelling units and 1,500 
farms of all sizes. 

Maps and sketch maps prepared for each 
of the enumeration seginents were used. 
This cartographic material was prepared 
based on the segmentation program of «he 
Republic for census and statistical purposes, 
(Source: Luisa E. Quesada, DEC, Panama, 
November 1959.) 


Recent statistical publications 


eo Two of the studies recently released 
by the DEC in the Estadística Panameña 
series (XVIII year) are: 

1. Accidentes de Tránsito, Año 1958 
(series “J,'”” no. 1, July 1959, 57 p.) which 
presents information on traffic accidents in 
the country by kind of accident, type of 
vehicle, place, day, and hour. 


2. Precios y Costo de la Vida (series 
“G.1,” no. 1, May 1959, 193 p.) which 
gives the results of the surveys of income 
and expenditure of the laborers and their 
families in the banana zones of Bocas del 
Toro and Puerto Armuelles, taken in April 
and January of 1956, respectively. The data 
refer to calendar year 1955. The results 
of a similar survey taken in the city of 
David and its environs in March of 1957 
were also presented, with data refering to 
1956. The selection of the families included 
in this study was made by the sampling 
method. (Sources: Luisa E. Quesada, DEC, 
Panama, November 1959; the publications 
mentioned.) 


Noticias personales 
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1.500 explotaciones 
tamaño. 

Se utilizaron mapas y croquis confeccio- 
nados para cada uno de los segmentos de 
enumeración. Este material cartográfico 
fue elaborado con base en el programa de 
segmentación de la República para fines 
censales y estadísticos. (Fuente: Luisa E. 
Quesada, DEC, Panamá, noviembre 1959.) 


agrícolas de todo 


Publicaciones estadísticas recientes 


e Dos de los estudios recientemente pu- 
blicados por la DEC en la serie Estadística 
Panameña (año XVII) son: 


1. Accidentes de Tránsito, Año 1958 
(Serie “J”, no. 1, julio 1959, 57 p.) que 
presenta información sobre los accidentes 
de tránsito en el país, clasificados por clase 
de accidente, tipo de vehículo, lugar, día 
y hora. 

2. Precios y Costo de la Vida (Serie 
“G.1”, no. 1, mayo 1959, 193 p.) que da 
los resultados de las encuestas, sobre in- 
gresos y gastos de los trabajadores y sus 
familias en la zona bananera de Bocas del 
Toro y Puerto Armuelles, tomadas en abril 
y enero de 1956, respectivamente. Los datos 
se refieren al año calendario de 1955. 
También se presentan los resultados de 
una encuesta similar tomada en la ciudad 
de David y sus alrededores en marzo de 
1957, con las cifras referidas a 1956. La 
selección de las familias incluídas en este 
estudio fue hecha por el método de mues- 
treo. (Fuentes: Luisa E. Quesada, DEC, 
Panamá, noviembre 1959; las publicaciones 
mencionadas.) 


e Asistieron al Seminario sobre Evaluación y Utilización de Datos Censales para América 


Latina, que tuvo lugar en Santiago de Chile, del 30 de noviembre al 18 de diciembre 
de 1959, los siguientes funcionarios de la Dirección de Estadística y Censo (DEC): 
Carlos Olmedo Quintero, director del Censo de Población y Vivienda; Herman ]. 
Rodriguez Jr., analista estadístico, e Hildebrando Araica, inspector, Sección Censo de 
Población y Vivienda. 


« 


e El Sr. Rodríguez también asistió como delegado observador de la República de 
Panamá a la VI Reunión del Comité de Cooperación Económica del Istmo Centroame- 
ricano, que se celebró en San José, Costa Rica, del 25 de agosto al 4 de septiembre 
de 1959. 


e El Sr. Juan Manuel Caballero D., miembro titular del IASI, fue designado jefe, 
Sección de Censo Agropecuario, DEC, Panamá, a partir de junio de 1959. Asistió como 
observador al Primer Ensayo Censal que se celebró en la República de Honduras del 
31 de agosto al 6 de septiembre de 1959. 
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eo Durante el mes de noviembre de 1959, el Sr, Charles E. Green, técnico en tabulación, 
Naciones Unidas, prestó asesoría técnica en la DEC para la planificación del proceso 
de tabulación censal. 


PARAGUAY 
Noticia personal 


e El Sr. Washington Ashwell, asesor económico del Presidente, Banco Central del 
Paraguay, Asunción, se encuentra en Washington, D.C., desde septiembre de 1959, por 
el período de un año, siguiendo un curso de entrenamiento auspiciado por el Fondo 
Monetario Internacional, sobre técnicas monetarias y financieras internacionales, y análisis 
de estadísticas económicas. 


PERÚ 


Recent statistical activities Actividades estadísticas recientes 


eo The National Bureau of Statistics eo La 
(DNE) has recently published: Anuario 
Estadístico del Perú, 1956-57 and Boletín 
de Estadística Peruana, 1958. The third 
issue for 1959 of the latter publication is 


currently being distributed The fourth 


Dirección Nacional de Estadística 
(DNE) ha publicado recientemente el 
Anuario Estadístico del Perú, 1956-57 y el 
Boletin de Estadística Peruana, 1958. 
Actualmente se está distribuyendo el tercer 
número de 1959 de la última de las pu- 
blicaciones citadas. El No. 4, próximo a 


issue, soon to appear, will contain new 


statistical tables on important aspects of 
national activity. 


eo A Statistical Laboratory has been 
established in the School of Economic 
Sciences of the University of San Marcos. 


e The Peruvian National 
Division of Biostatistics which functions 
under the Inter-American  Cooperative 
Service for Public Health (SCISP) publish- 
ed three annual bulletins during 1959: 
Las Enfermedades Transmisibles en el 
Perú, 1955; Estadísticas Hospitalarias en 
el Perú, 1958; and La Demografía de las 
Principales Ciudades Peruanas, 1958. In 
addition, a new issue Of the monthly 
Boletín Epidemiológico del Perú was 
published. All of the bulletins contained 
more detailed tables than in previous years. 
(Sources: Gregorio Garayar P., DNE, 
Lima, October 1959; Joseph A. Cavanaugh, 
SCISP, Lima, December 1959.) 


Program and 


Noticias personales 


aparecer, contendrá nuevos cuadros esta- 
dísticos sobre importantes rubros de la 
actividad nacional. 


e Se ha organizado un Laboratorio de 
Estadística en la Facultad de Ciencias Eco- 
nómicas de la Universidad de San Marcos. 


e El Programa Peruano Nacional y Di- 
visión de Bioestadística que funciona bajo 
el Servicio Cooperativo Interamericano de 
Salud Pública (SCISP) publicó tres bole- 
tines anuales durante 1959: Las Enferme- 
dades Transmisibles en el Perú, 1958; Es- 
tadísticas Hospitalarias en el Perú, 1958; 
y La Demografía de las Principales Ciuda- 
des Peruana, 1958. Además fue publicada 
la edición mensual del Boletín Epidemio- 
lógico del Perú, Todos los boletines con- 
tienen cuadros más detallados que en los 
años anteriores. (Fuentes: Gregorio Ga- 
rayar P., DNE, Lima, octubre 1959; Joseph 
A. Cavanaugh, SCISP, Lima, diciembre 
1959.) 


e El Sr. Marcial Lara Aranguri, jefe, Departamento de Estadística, División de Bioes- 
tadística, Servicio Cooperativo Interamericano de Salud Pública, Lima, llegó a Washington, 
D.C., en septiembre de 1959, becado por la International Cooperation Administration 
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y la Division of International Health (DIH) de los Estados Unidos, por un período de 
seis meses para el entrenamiento en técnicas de muestreo, análisis demográfico, progra- 
mación de tabulación mecánica, administración estadística en el Bureau of the Census; 
estadísticas vitales y de salud en la DIH y cursos académicos en estadística en la 


American University. 


e El Sr, Abelardo Temoche, asistente médico, Ministerio de Salud Pública, Lima, asiste 
desde septiembre de 1959, a la Harvard University (E.U.A.) para hacer un año de entre- 
namiento en estadísticas vitales, con beca otorgada por la Oficina Sanitaria Panamericana. 


REPÚBLICA DOMINICANA 


Experimental censuses 


e The General Bureau of Statistics (DGE) 
carried out two experimental censuses in 
August 1959: one of population on August 
9 in the city of Monseñor Nouel and in 
the La Salvia section of that municipality, 
and, also in the latter area, one of agri- 
culture on August 10-12. The objectives 
were to test the census schedules and other 
auxiliary questionnaires as well as the 
entire census organization and to obtain 
information for some estimates to be used 
in the 1960 census. At present, the schedules 
are being edited and the results studied. 
(Source: Ernesto Simó Clark, DGE, Ciudad 
Trujillo, November 1959.) 


Noticias personales 


Censos experimentales 


e La Dirección General de Estadística 
(DGE) llevó a cabo, en el mes de agosto 
de 1959, dos censos experimentales: el de 
población se realizó el día 9 de agosto en 
la ciudad de Monseñor Nouel y en la 
sección La Salvia del mismo municipio, en 
esta última área se efectuó el censo experi- 
mental agropecuario del 10 al 12 de dicho 
mes. Los objetivos fueron probar las cé- 
dulas censales y demás formularios auxi- 
liares, así como toda la organización censal 
y obtener información para algunos cálculos 
que se utilizarán en el Censo de 1960. En 
la actualidad se están criticando las cédu- 
las y estudiando los resultados. (Fuente: 
Ernesto Simó Clark, DGE, Ciudad Trujillo, 
noviembre 1959.) 


e El Sr. Ernesto Simó Clark fue designado director general, Dirección General de 
Estadística (DGE), a partir de octubre de 1959, 


e El Sr. Abelardo E. Achécar fue designado, en octubre de 1959, para ejercer el cargo 
de subdirector técnico en la DGE, en reemplazo del Sr. Simó Clark. 


UNITED 


Quality control of field enumeration 
in 1960 censuses 


e As part of the 1960 Census of Popula- 
tion and Housing field operations, the 
United States Bureau of the Census will 
institute a statistical qualitv control pro- 
gram by means of which the work of 
enumerators will be inspected while the 
Census is in progress. A Technical Officer 
in each of the 392 district offices will have 


STATES 


Control de calidad de la enumeración 
en los censos de 1960 


e Como parte de las operaciones de los 
Censos de Población y Vivienda de 1960, 
la Dirección del Censo de los Estados Uni- 
dos establecerá un programa estadístico de 
control de calidad, por medio del cual se 
inspeccionará el trabajo de los enumerado- 
res mientras se está llevando a cabo el 
Censo. Un funcionario técnico en cada una 
de las 392 oficinas de distrito tendrá la 
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primary responsibility for supervising this 
program and training field and office 
personnel to perform quality control 
functions. 


Each of the 10,000 crew leaders will 
supervise an average of 16 enumerators. 
Since supervision will consist mainly in 
reviewing the work of enumerators, crew 
leaders will need to be assisted by field 
reviewers selected from among the best 
enumerator candidates in their crews. 


After enumerators have been trained, 
arrangements will be made to “induct” 
enumerators into their enumeration areas; 
that is, crew leaders and field reviewers 
will accompany enumerators to the place 
where they are to start work and will 
observe the way in which they interview 
the first three households. Crew leaders 
and field reviewers will also schedule ap- 
pointments with enumerators to review 
their work. No field review appointments 
will be scheduled on April 1 (date on 
which Census canvassing begins) in order 
to complete induction and to  permit 
enumerators to complete sufficient work to 
be reviewed. 


Acceptance criteria have been established 
to permit the crew leader to make one of 
three possible decisions at the time of the 
first field review: (1) the enumerator is 
doing highly acceptable work and does not 
have to have his work reviewed again until 
he is ready to turn in his completed as- 
signment; (2) the quality of the enu- 
merator's work indicates that a second 
review is necessary; and (3) the quality 
of the enumerator's work indicates that 
his appointment should be terminated, 


Acceptance standards have also 
established for second and third field 
reviews which direct the crew leader to 
accept work without further review, ter- 
minate enumerators, or schedule additional 
reviews. 


been 


Enumerators will be paid a fee for time 
spent in field review. Stage 1 enumerators 


will have their work inspected at 
twice under this proposal. In Stage II, 
enumerators will have their field work 
reviewed at least four times. 


least 


Persons doing field review work will 
prepare a separate field review form for 
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responsabilidad principal en la supervisión 
de este programa y en el entrenamiento del 
personal de campo y de oficina para que 
ejerzan funciones de control de calidad. 

Cada uno de los 10.000 dirigentes de 
equipo supervisará un promedio de 16 enu- 
meradores. Dado que la supervisión con- 
sistirá principalmente en revisar el trabajo 
de los enumeradores, los dirigentes de equi- 
pos necesitarán la ayuda de auxiliares de 
campo, seleccionados de entre los mejores 
enumeradores de sus equipos. 

Después del entrenamiento de los enu- 
meradores, se hará lo necesario para pre- 
sentar a los enumeradores en sus áreas de 
encuesta, esto quiere decir, que los dirigen- 
tes de equipo y los auxiliares de campo 
acompañarán a los enumeradores al lugar 
donde comenzarán a trabajar, y observarán 
la forma en que llevan a cabo las entre- 
vistas en los tres primeros hogares. Los 
dirigentes de equipo y los auxiliares de 
campo también organizarán entrevistas con 
sus enumeradores para revisar sus trabajos. 
No se provectará ninguna revisión de cam- 
po para el 1 de abril (fecha en que co- 
menzará el Censo) a fin de completar la 
organización y permitir a los enumeradores 
realizar suficiente trabajo como para ser 
revisado. 

Se ha establecido un criterio de acep- 
tación para permitir que el dirigente del 
equipo realice una de las tres decisiones 
posibles en el momento de la primera re- 
visión de campo; (1) el enumerador está 
afectuando un trabajo muy aceptablemente 
y no es necesario revisar su trabajo de 
nuevo hasta que esté listo para entregar 
su asignación completa; (2) la calidad del 
trabajo del enumerador indica que será 
necesaria una segunda entrevista; y (3) la 
calidad del trabajo del enumerador indica 
que su designación deberá darse por ter- 
minada. 

También han sido establecidos estánda- 
res de aceptación para la segunda y tercera 
entrevistas, que indican al dirigente del 
equipo la aceptación del trabajo sin más 
revisiones, la cancelación de enumeradores 
o la organización de entrevistas adicionales. 

Se pagará a los emumeradores por el 
tiempo empleado durante las revisiones de 
campo. El trabajo de los enumeradores de 
la I etapa será inspeccionado dos veces por 
lo menos bajo esta propuesta. En la Il 
etapa el trabajo de los enumeradores habrá 
sido revisado por lo menos cuatro veces. 

Las personas ocupadas en el trabajo de 
revisión llenarán un formulario separado 





each enumerator. This form is a check 
list which describes the method for select- 
ing the sample of work to be reviewed and 
the various coverage and content checks 
which reviewers are to perform. Printed 
on the form is the set of quantitative 
standards for determining the quality of 
the enumerator's work together with the 
kinds of action which reviewers are to take 
depending on the results of the particular 
review. 

Before census taking begins, crew leaders 
will make a partial list of addresses in 
each This will be 
checked during field review to determine 


enumerator's area. 
whether enumerators are canvassing their 
districts thoroughly. Crew leaders will also 
make preliminary estimates of the number 
of units district at 
this time which will provide an additional 
check on coverage. Other checks made 
during the field review operation include 
examining schedules for omissions, inade- 
quate 


in each enumeration 


Fosdic marking, inconsistency of 
information, accuracy of transcription from 
and 


payroll 


schedules 
and 


questionnaires to Fosdic 


verification of counts 
computations. 

Quality control clerks will inspect the 
schedules as they are received in the district 
office. The results of inspection will be 
maintained crew 
The Officer 
informed immediately by the office quality 
control when 
specific district fails inspection so that he 


separately by leader 


district. Technical is to be 


supervisor work from a 


may take corrective action. (Source: Jack 
Silver, Bureau of the Census, Washington, 
D.C., November 1959.) 


Preliminary report series—1958 
Census of Business 


e On August 31, 1959, the Bureau of the 
Census of the United States issued the first 
in the series of preliminary reports from 
the 1958 Census of Business entitled 
Preliminary Retail Trade Report for the 
State of Georgia. The remaining State 
reports in the preliminary retail trade 


series are scheduled for issuance during 
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para cada enumerador, Este formulario es 
una lista de control que describe el mé- 
todo para seleccionar la muestra del traba- 
jo a revisar y los distintos controles de co- 
bertura y de contenido, que deben efectuar 
los revisores. Impreso en el formulario hay 
un juego cuantitativo de estándares para 
determinar la calidad del trabajo del enu- 
merador, junto con las clases de determi.- 
naciones que deberán tomar los revisores, 
de acuerdo a los resultados de cada en- 
trevista. 

Antes que comience el Censo, los diri- 
gentes de equipo confeccionarán listas par- 
ciales de direcciones correspondientes al 
área de cada enumerador. Estas listas serán 
controladas durante las revisiones de cam- 
po, a fin de determinar si los enumeradores 
están efectuando el censo completo en sus 
distritos. Los dirigentes de equipo también 
efectuarán estimaciones preliminares de la 
cantidad de unidades en cada distrito de 
enumeración, que será un control adicional 
sobre el alcance del censo. Otros controles 
que se efectuarán durante las operaciones 
de revisión de campo incluyen planillas 
para omisiones, marcación Fosdic inade- 
cuada, falta de consistencia en las infor- 
maciones, exactitud en la transcripción de 
los cuestionarios a las planillas Fosdic y 
verificación de recuentos y cálculos de 
sueldos. 

Empleados del control de calidad ins- 
peccionarán las planillas en el momento de 
su llegada a las oficinas de recepción. Los 
resultados de las inspecciones serán man- 
tenidos por separado para cada distrito del 
dirigente de equipo. El funcionario técnico 
debe ser informado inmediatamente por 
el supervisor de la oficina de control de 
calidad cuando el trabajo de algún distrito 
específico no pase la inspección, a fin de 
que él pueda tomar medidas correctivas. 
(Fuente: Jack Silver, Dirección del Censo, 
Washington, D.C., noviembre 1959.) 


Serie de informes preliminares 
del Censo de Comercio, de 1958 


e El 31 de agosto de 1959, la Dirección 
del Censo de los Estados Unidos, publicó 
el primero de una serie de informes pre- 
liminares del Censo de Comercio de 1958, 
con el título de Preliminary Retail Trade 
Report for the State of Georgia. Los in- 
formes preliminares de la serie sobre co- 
mercio al por menor de los restantes esta- 
dos, serán publicados durante septiembre 
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September and October. A comparable 
series of preliminary reports for the service 
trades are scheduled for issuance from 
November 1959 through February 1960, and 
for wholesale trade, January and February 


1960. 


Tables in the preliminary retail trade 
reports compare number of establishments 
and dollar volume of sales in 1954 and 
1958 for the major retail kind-of-business 
groups in the State. They provide 1958 
data on establishments, sales, payroll, and 
personnel: (1) For major kind-of-business 
groups and for 18 more detailed kinds of 
business in the State; (2) for all retail 
trades combined for each county and each 
city or other municipality of 2,500 or more 
inhabitants; and (3) for major retail kind- 
-of-business groups in each standard me- 
tropolitan statistical area in the State. 
They also provide 1954 data on establish- 
ments, sales and payroll for all retail trades 
combined for the counties and cities. 


Other 1958 Census of Business publica- 
tions scheduled for issuance during 1960 
include the final area bulletin series, the 
subject bulletin series (such as employment 
size, sale size, legal form of organization, 
and wholesale commodity line), and the 
central business district bulletin series. The 
schedule for issuance of these series and 
of the preliminary bulletin series reflects 
a saving of several months over the 1954 
Census issuance dates which were the 
earliest previously achieved for the census 
of business. 


Copies of the 54 preliminary retail trade 
reports (U.S. Summary, 50 States, District 
of Columbia, Guam, and Virgin Islands) 
may be purchased at $0.15 (U.S.) each 
from the Bureau of the Census, Washington 
25, D.C., or from the field offices of the 
Department of Commerce. The price of 
the complete set will be $6.00 (U.S.). The 
same prices will apply to the separate series 
of preliminary reports for wholeasale trade 
and selected service trades. (Source: Harvey 
Kailin, Bureau of the Census, Washington, 
D.C., December 1959.) 


y octubre. Una serie comparable de infor- 
mes preliminares sobre actividades de ser- 
vicios será publicada a partir de noviembre 
de 1959 hasta febrero de 1960, y para el 
comercio al por mayor, de enero a febrero 
de 1960. 


En los cuadros de los informes prelimi- 
nares del comercio al por menor se com- 
paran el número de establecimientos y el 
volumen en dólares, de las ventas en 1954 
y 1958, para los mayores grupos de comer- 
cios similares al por menor. Estos cuadros 
dan cifras para el año 1958 sobre estable- 
cimientos, ventas, sueldos y personal para: 
(1) Los grupos mayores de comercios simi- 
lares y para otros 18 grupos más detallados 
de tipos de negocios en el estado; (2) para 
todos los comercios al por menor combi- 
nados por condado y ciudad u otra muni- 
cipalidad de 2.500 o más habitantes; y (3) 
para los grupos mayores de comercios al 
por menor similares en cada área estadís- 
tica metropolitana estándar en el Estado. 
Pambién proveen datos de 1954 sobre 
establecimientos, ventas y sueldos para to- 
dos los comercios al por menor combinados 
por condados y ciudades. 


Otras publicaciones del Censo de Comer- 
cio de 1958, que están proyectadas durante 
1960, incluyen una serie de boletines finales 
de área, la serie de boletines por materia 
(tales como: empleos, tamaño, valor de las 
ventas, forma legal de organización y ramo 
comercial al por mayor), y la serie de 
boletines del comercio de distritos centra- 
les. El programa de publicación de estas 
series y de las series de boletines prelimi- 
nares, refleja el ahorro de varios meses 
sobre el Censo de 1954, cuyas fechas de 
publicación fueron, a su vez, las más rápi- 
das que se habían logrado hasta entonces, 
para un censo de comercio. 


Ejemplares de los 54 informes prelimi- 
nares del comercio al por menor (Resumen 
para los Estados Unidos, 50 Estados, Dis- 
trito de Columbia, Guam y las Islas Vírge- 
nes), pueden adquirirse a razón de $0,15 
(U.S.) cada uno en el “Bureau of the 


Census, Washington 25, D.C., o en las 
oficinas respectivas del “Department of 
Commerce”. El precio de la serie completa 
será de $6,00 (U.S.). Los mismos precios 
regirán para las series separadas de los 
informes preliminares para el comercio al 
por mayor y para las actividades de ser- 
vicios seleccionados. (Fuente: Harvey 
Kailin, Dirección del Censo, Washington, 
D.C., diciembre 1959.) 





Comparability of Census of 
Manufactures Industries, 1929-58 


e Historical Comparability of Census of 
Manufactures Industries, 1929-1958, has 
been issued by the Bureau of the Census 
of the United States as Working Paper 
No. 9. This publication explains the extent 
of comparability among industries covered 
in the reports issued for the censuses of 
manufactures 1929 to 1958 and 
describes the mature of adjustments neces- 
sary attain comparability for a large seg- 
ment of the industry 
universe. 


The each of the 
approximately 430 industry classifications 
used in the 1958 Census of Manufactures 
to comparable categories used in the 
1929-1954 censuses, showing which indus- 


from 


manufacturing 


report also  relates 


tries or parts of industries (usually prod- 
ucts) listed in 
constitute the 


these prior census reports 
used in the 
1958 census reports. In effect, this indicates 
the primary 1958 
Census have been assigned to the industries 
A descriptive sum- 
highlights of  census 
classification and code structure 
from 1929 through 1958. Actual 
statistics on a comparable basis 


period are not presented. 


classifications 


how products of the 
used in earlier censuses. 
mary covers the 
industry 
changes 
industry 
for this 

The tables in 
this report provide the basic framework 
for retabulating and compiling comparable 
industry data from 1929 to 1958. They 
also provide historical perspective for trac- 
ing and comprehending the evolution of 
the 1958 industry classifications; some 
background in evaluating the appropriate- 
ness of future changes in industry defini- 
tions; basic information for understanding 
and using past census industry data by 
indicating the nature and extent of 
comparability or lack of comparability with 
the present; and a basis for making ap- 
propriate and meaningful combinations of 
present industrv classifications to extend 
comparability of data over the 1929-1958 
period without the need for reclassifying 
and  retabulating earlier establishment 
schedules. 


historical comparability 


Only a small portion of the industries 
as defined in the 1958 Census of Manu- 
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Comparabilidad del Censo de 
Industrias Manufactureras, 1929-58 


e La Dirección del Censo de los Estados 
Unidos, ha dado a publicidad, como do- 
cumento de trabajo No. 9, un folleto titu- 
lado Historical Comparability of Census of 
Manufactures Industries, 1929--1958. Esta 
publicación explica el alcance de la com- 
parabilidad entre las industrias abarcadas 
en los informes publicados sobre los censos 
industriales de 1929 a 1958, y describe la 
naturaleza de los ajustes necesarios para 
lograr la comparabilidad de un gran sector 


en el universo de la industria manufac- 
turera. 


El informe relaciona también cada una 
de las aproximadamente 430 clasificaciones 
industriales, utilizadas en el Censo Indus- 
trial de 1958, con las categorías compara- 
bles usadas en los censos de 1929-1954, 
mostrando qué industrias o partes de in- 
dustrias (usualmente productos) enumera- 
das en los anteriores informes censales 
constituven las clasificaciones usadas en los 
informes censales de 1958. En efecto, esto 
indica como los productos primarios del 
Censo de 1958 han sido asignados a las 
industrias usadas en los censos anteriores. 
Un sumario descriptivo explica lo más so 
bresaliente de la clasificación industrial del 
censo y los cambios en la estructura del 
código desde 1929 hasta 1958. No se pre- 
sentan, para este período, estadísticas in- 
dustriales reales sobre bases comparables. 


En este informe, los cuadros de compa- 
ración histórica proveen el marco básico 
de trabajo para retabular y compilar los 
datos industriales comparables desde 1929 
hasta 1958. Ellos proporcionan también una 
perspectiva histórica para seguir y com- 
prender la evolución de las clasificaciones 
industriales de 1958; algunos antecedentes 
para evaluar la propiedad de futuros cam- 
bios en las definiciones industriales; infor- 
mación básica para el entendimiento y uso 
de los datos de los censos industriales 
anteriores con indicación de la naturaleza 
y extensión de la comparabilidad o falta 
de comparabilidad con el presente; y una 
base para hacer combinaciones apropiadas 
y significativas de las clasificaciones indus- 
triales actuales para extender la compara- 
bilidad de los datos sobre todo el período 
1929-1958 sin necesidad de reclasificar y 
retabular los anteriores formularios sobre 
establecimientos. 
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factures is comparable for the 1929-1958 
period without some adjustment. Of the 
130 industry used in the 
1958 Census, 94 are comparable without 
adjustment. These accounted for 14 percent 
of the total manufacturing value added in 
1954. 

The required to increase 
comparability of the remaining classifica- 
tions are of three principal types: (1) 
Meaningful combinations of industries; (2) 
reclassification of individual establishment 
schedules in earlier census years; and (3) 
use Of 1954 Census industry definitions. By 
making these  adjustments, 
industry and geographic 
obtained for an 


classifications 


adjustments 


comparable 
data can be 
additional 170 industry 
categories which account for 76 percent of 
1954 value added for all manufacturing 
industries. Comparable data 
be available for an 


thus 
aggregate of 264 
industry categories representing 90 percent 
of value added in 1954. 

Fhe stimulus for report came in 
large part from the monograph program 
of the Committee on Analvsis of Economic 
Census Data of the Social Science Research 
Council. 


would 


this 


Copies of Historical 
Census of Manufactures Industries, 1929- 
-1958 (63 pages, $1.00—U.S.) may be 
purchased from the Bureau of the Census, 
Washington 25, D.C. or from the field 
offices of the Department of Commerce. 
(Source: Harold T. Goldstein, Bureau of 
the Census, Washington, D.( November 
1959.) 


Comparability of 


Survey of commercial grain 
warehouse operational costs 


e The Commodity Stabilization Service of 
the United States Department of Agricul 
ture is conducting a national sample survey 
of costs of storing 


grain in commercial 


country and terminal warehouses, covering 
Results 
of the survey will provide a basis for the 
Commodity 


operations during the past vear. 


Credit Corporation to deter- 
mine whether present storage rates under 
the Uniform Grain Storage Agreement are 
fair and equitable under present conditions. 

A8l information is 
personal interview, 


being collected by 
using qualified staff 


Sólo una pequeña porción de las indus- 
trias como están definidas en el Censo In- 
dustrial de 1958 es comparable, sin ajuste, 
con las del perívdo 1929-1958. De las 430 
clasificaciones industriales utilizadas en el 
Censo de 1958, 94 son comparables sin 
ajustes. Estas representaban el 14 porciento 
del total del valor agregado de las ma- 
nufacturas en 1954. 


Los ajustes requeridos para aumentar la 
comparabilidad del resto de las clasifica- 
ciones, son de tres tipos principales: (1) 
Combinaciones significativas de industrias; 
(2) reclasificación de los formularios indi- 
viduales de los establecimientos en años cen- 
sales anteriores; y (3) uso de las definicio- 
nes industriales del Censo de 1954. Por 
haber hecho estos ajustes pueden obtenerse 
datos industriales y geográficos compara- 
bles para unas 170 categorías industriales 
adicionales, que representan el 76 porcien- 
to del valor agregado de 1954 para todas 
las industrias manufactureras. Los datos 
comparables estarían, de este modo, dispo- 
nibles para un total de 264 categorías in- 
dustriales que representarán el 90 por- 
ciento del valor agregado de 1954. 


El estímulo para realizar este informe 
vino, en gran parte, del programa de mo- 
nografías del Comité de Análisis de datos 
de Censos Económicos del Consejo de In- 


vestigación de Ciencias Sociales. 


Copias del Historical Comparability of 
Census of Manufactures Industries, 1929- 
3 págs., $1,00—U.S.) pueden ad- 
quirirse en el “Bureau of the Census, 
Washington 25, D.( (Fuente: Harold T. 
Goldstein, Dirección del Censo, Washing 
ton D.C., noviembre 1959.) 


1958, (63 


Encuesta sobre 


operación de 
los depósitos comerciales de granos 


gastos de 


e El Servicio de Estabilización de Mer- 
caderías del Departamento de Agricultura 
de los Estados Unidos, está llevando a cabo 


una encuesta nacional por muestreo sobre 


los costos del almacenaje de gramos en los 
depósitos comerciales rurales y terminales, 
cubriendo las operaciones efectuadas du- 
rante el año pasado. Los resultados de la 
encuesta proveerán las bases a la Corpo- 


ración de Créditos de 


determinar si 


Mercaderías 
las tasas actuales de alma- 
cenaje, según el Convenio Uniforme de 
Almacenaje de Granos, son justas y equita- 
tivas en las condiciones presentes. 


para 
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accountants who have been assigned to the 
Administrator's office for this survey. The 
information obtained will include size and 
type of facilities, levels of occupancy by 
months and by type of grain, volume flow 
of grain through facilities, disposition data, 
revenue by functions, and costs prorated 
according to business activities. 

The probability sample is comprised of 
534 storage facilities, of which 128 are 
terminal elevators and 406 are country 
warehouses. For the terminal elevators, 120 
strata of 5 elevators each were formed to 
provide maximum homogeneity with re- 
spect to capacity, commodities handled, and 
One 


from 


geographic location. elevator was 


selected at random each stratum, 
except for Western States where the sam 
pling rate was doubled. For country ele- 
vators, tre number of facilities, their total 
capacity, and numbers storing each com- 
modity involved, were recorded on county 
outline maps and primary sampling units 
(p.s.u.) were formed so that each would 
have a minimum of 5 facilities. An array 
of p.s.u. was defined by assigning each 
a serial number on the map to provide for 
geographic and commodity grouping. From 
an accumulative array, a systematic sample 
was selected with probability proportional 
to number of facilities. With few excep- 
tions, a subsample of 5 facilities was drawn 
The 
(Source: 
J. Richard Grant, Agricultural Marketing 
Service, Washington, D.C., October 1959.) 


from each of the selected p.s.u. 


overall sampling rate was 1/24. 


Survey of transportation and 
distribution of products 


e The Bureau of the Census of the United 
States recently initiated a survey of the 
transportation and geographic distribution 
of products by 
The 
distinctly different survey methods: 


eastern manufacturing 


companies. project involves two 
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Se está obteniendo toda la información 
por medio de entrevistas personales, utili- 
zando enumeradores calificados, que han 
sido asignados a la oficina del Administra- 
dor para esta encuesta. La información ob- 
tenida incluirá tamaño y tipo de las faci- 
lidades, niveles de ocupación por meses y 
por tipo de grano, volumen del movimien 
to de los granos a través de las instalacio- 
nes, fecha de disposición, ingresos por ope- 
ración, y costos prorrateados de acuerdo 
con las actividades comerciales. 


La muestra de probabilidad comprende 


534 instalaciones para almacenaje, de las 
cuales 128 “son elevadores terminales y 406 
son depósitos rurales. Para los elevadores 
terminales, se formaron 120 estratos de 5 
elevadores cada uno para proveer la máxi- 
ma homogeneidad con respecto a la ca- 
pacidad, mercaderías manipuladas, y ubi- 
cación geográfica. Se eligió al azar un 
elevador de cada estrato, con excepción de 
los Estados del Oeste donde se duplicó la 
tasa del muestreo. Para los elevadores ru- 
rales, se registró la cantidad de instalacio- 
nes, su capacidad total, y las cantidades que 
almacenan de cada artículo, sobre mapas 
de contorno de los condados, y se formaron 
unidades primarias de muestreo (u.p.m) 
para que cada una tuviera un mínimo 
de 5 instalaciones. Se definió un ordena- 
miento de u.p.m. al asignarle a cada una 
un número de orden sobre el mapa para 
facilitar el agrupamiento geográfico y por 
mercadería. Del ordenamiento acumulativo 
se seleccionó una muestra sistemática con 
probabilidad proporcional al número de 
instalaciones. Con pocas excepciones se 
extrajo una submuestra de 5 instalaciones 
de cada una de las u.p.m. seleccionadas. 
La tasa general de muestreo fue de 1/24. 
(Fuente: J. Richard Grant, Servicio de Co- 
mercialización Agropecuaria, Washington, 
D.C., octubre 1959.) 


Encuesta sobre el transporte y 
la distribución de productos 


e La Dirección del Censo de los Estados 
Unidos inició recientemente una encuesta 
sobre el transporte y la distribución geo- 
gráfica de productos manufacturados por 
compañías del este del país. El plan com- 
prende dos métodos de encuestas clara- 
mente diferentes: 
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(1) The customary “shipper survey” 
technique will be used to obtain specific 
data for large companies in selected classes 
of industry, showing the volume of ship- 
ments by means of transport, distance to 
market or redistribution point, and relative 
volume of shipments by size of transaction. 
The data will be obtained by personal 
interview coupled with collection of detail- 
ed facts from a sample of transactions as 
shown by sales invoices or other documents 
at company or plant h adquarters. 


(2) A 
collect 


mail survey is being used to 


general geographic 
distribution of products on an establish- 


data on the 


ment basis. This phase is experimental and 
designed to test the feasibility of using a 
mail 
estimate the volume of interregional trade 
and movements by distances from plants 
to markets or redistribution points. 


relatively  low-cost technique to 


The project is sponsored by the Traffic 
Association—Eastern Railroads. The initial 
surveys will involve the refractory, glass, 
roofing felt and hard surface floor coverings 
industries. Other selected industries are 
expected to be surveyed as the work pro- 
gresses. (Source: Donald E. Church, Bureau 
of the Census, D.C., Sep- 
tember 1959.) 


Washington, 


New list of standard metropolitan 
statistical areas 


eo A  12-page document on Standard 
Metropolitan Statistical Areas has been 
published by the United States Bureau of 
the Budget, presenting the revised list of 
definitions for 192 metropolitan areas and 
two Standard Consolidated 
introductory 
describes the 


Areas. In an 
statement the  pamphlet 
purposes to be served by 
delineation of the areas and sets forth the 
criteria bv which they are defined. 
Standard definitions were first issued in 
1949 to make it possible for all Federal 
statistical agencies to use the same bound- 
aries in publishing statistical data on 
metropolitan areas. Definitions in terms of 
counties (in New England of towns) are 
established by the Bureau of the Budget 
with the advice of the Federal Committee 
on Standard Metropolitan Statistical Areas, 
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(1) La técnica usual de “encuestas al 
expedidor'” será empleada para obtener de 
grandes compañías, de clases seleccionadas 
de industrias, datos específicos sobre em- 
barques según los medios de transporte, 
distancia al mercado o punto de redistri- 
bución, y volumen relativo de los embar- 
ques según el valor de las transacciones. 
Los datos serán obtenidos por entrevistas 
personales junto con la colección de hechos 
detallados de una muestra de transacciones 
obtenidas de las facturas de ventas u otros 
documentos de la compañía o de la planta 
de operaciones. 


(2) Para reunir datos sobre la distribu- 
ción geográfica general de los productos 
en base a los establecimientos se realiza 
una encuesta por correo. Esta fase es ex- 
perimental y está diseñada para probar la 
posibilidad de usar una técnica por correo 
a costo relativamente bajo para estimar el 
volumen del comercio interregional y los 
movimientos por distancias desde las plan- 
tas a los mercados o los puntos de 
tribución. 


redis 


El plan está patrocinado por la Traffic 
Association-Eastern Railroads. Las encues- 
tas iniciales comprenderán las industrias 
refractarias, vidrios, fieltro para techados 
y cubiertas duras para pisos. Cuando el 
trabajo avance se espera que se investiguen 
otras industrias seleccionadas. (Fuente: 
Donald E. Church, Dirección del Censo, 
Washington, D.C., septiembre 1959.) 


Nueva ¡ista de áreas estadísticas 
metropolitanas estándar 


e La Dirección del Presupuesto de los 
Estados Unidos ha publicado un documento 
de 12 páginas sobre Standard Metropolitan 
Statistical Areas, en el que se presenta la 
lista revisada de las definiciones de 192 
áreas metropolitanas y dos Areas Estándar 
Consolidzdes. En una declaración intro- 
ductoria, el folleto describe los propósitos 
pira los cuales servirá la delineación de 
lus áreas y establece el criterio por el cual 
están definidas. 


Las definiciones estándar fueron publica- 
das primero en 1949, para posibilitar el 
uso, a todas las oficinas federales de esta- 
dística, de los mismos límites al publicar 
datos estadísticos sobre áreas metropolita- 
nas. Las definiciones en términos de con- 
dados, (en Nueva Inglaterra de pueblos) 
son establecidas por la Dirección del Pre- 
supuesto con el asesoramiento de la Comi- 
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representing the major Federal statistical 
agencies. The areas are delineated on the 
basis of specific and objective criteria of 
a quantitative nature. Revised criteria 
were adopted by the committee in March 
1958. 

AU area definitions have been reviewed 
in terms of the revised criteria. When 
compared with the October 1950 list, the 
mew list of 192 and 40 
the 20 new 
areas, population growth as indicated by 
special 


includes 20 
amended area definitions. Of 


nen 


censuses accounted for 9; the 


amended central city criterion providing 
for twin city 


eligibility accounted for 4; 


annexations for 2; and 


splitting of pre- 
viously defined areas 5. Of those subdivided 
into two or more areas, the Chicago area 
New 


are probably the 


and York-Northeastern New Jersey 


area most significant, 
with the Chicago area being split into two 
areas and the New York-Northeastern New 
Jersey area divided into four areas. To 
meet the need for more inclusive metro- 
politan area statistics for these areas, the 
new desgination of Standard Consolidated 


Areas has been added. 


The new list of 192 Standard Metropoli- 


tan Statistical Areas will be used in 
tabulating data from the 1958 Censuses of 
Business, Manufactures and Mineral 
and the 1960 Censuses of 
Population and Housing. It will also be 
used in presenting current employment and 
payroll data, in labor market and housing 
market analysis, and for various other sta- 
tistical and analytical 


Industries 


JUTrposes. 
pur] 


Copies of Standard Metropolitan Statis- 
tical Areas ($0.15—U.S.) may be purchased 
from the Superintendent of 
Government Printing Office, Washington 
25, D.C. (Source: Peyton Stapp, Bureau of 


the Budget, Washington, D.C., October 
1959.) 


Documents, 


Federal Statistics Users” 
Conference 

e The Third Annual Meeting of the 

Federal Statistics Users Conference (FSUC) 

held at the 


was Statler-Hilton 


Washington. D.C. on 


Hotel in 
September 29-30, 
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sión Federal de Areas Estadísticas Metropo- 
litanas Estándar, en representación de las 
principales oficinas estadísticas federales. 
Las áreas están delineadas sobre la base de 
criterios específicos y objetivos de natura- 
leza cuantitativa. Un criterio revisado fue 
adoptado por la Comisión, en marzo de 
1958. 

Podas las definiciones de áreas han sido 
examinadas en 
sado. 


términos del criterio revi- 
Cuando se la compara con la lista 
de octubre de 1950, la lista nueva de 192 
áreas incluye 20 definiciones de nuevas 
áreas v 40 definiciones de áreas rectifica- 
das. De las 20 áreas nuevas, 9 se debían 
al crecimiento de la población, tal como 
lo indicaban los censos especiales; 4 se 
debieron al criterio rectificado de ciudad 
central, que prevé la posibilidad de elegi- 
bilidad de ciudades gemelas; 2 se debieron 
a anexiones; v 5 a la división de áreas de- 
finidas anteriormente. De las áreas que 
fueron subdivididas en dos o más áreas, 
probablemente las mas significativas son el 
área de Chicago y el área de Nueva York- 
Nueva Jersey del Notdeste; habiéndose di 
vidido el área de Chicago en dos áreas y 
el área de Nueva York-Nueva Jersey del 
Nordeste en cuatro áreas. Para cubrir las 
necesidades de estadísticas más completas 
para éstas áreas metropolitanas, se ha 
agregado la nueva designación de Areas 
Estándar Consolidadas. 

La nueva lista de 192 Areas Estadísticas 
Metropolitanas Estándar, será utilizada 
para tabular datos de los Censos de Comer- 
cio, Industria y Minería de 1958 y de los 
Censos de 1960 de Población y Vivienda. 
Pambién será utilizada para presentar da- 
tos corrientes de empleo y de las nóminas 
de pago, en el análisis del mercado de 
trabajo y del mercado de viviendas, y para 
varios otros fines de análisis y estadística. 

Copias de Standard Metropolitan Statis- 
tical Areas (5$0,15—U.S.) pueden obtenerse 
de Superintendent of Documents, Govern 
ment Printing Office, Washington 25, D.C. 
(Fuente: Peyton Stapp, Dirección del Pre- 
supuesto, Washington, D.C., octubre 1959.) 


Conferencia de los Usuarios 
de Estadísticas Federales 


e La Tercera Reunión Anual de la Con- 
ferencia de los Usuarios de Estadísticas 
Federales, (FSUC) se llevó a cabo en el 
Hotel Statler-Hilton en Washington, D.C., 
en septiembre 29-30 de 1959. La concurren- 
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1959. Attendance was larger than for either 
of the previous annual meetings. More 
than 100 nongovernmental users of Federal 
statistics and 60 guests from Federal statis- 
tics-producing agencies participated in the 
various sessions. 


The vice president of the Chase Manhat- 
tan Bank, speaking at the September 29 
luncheon session, paid tribute to the 
development of Federal statistics over the 
past 30 years but noted the need to reduce 
still further “the area of conjecture.'” He 
saw need for better information on: (1) 
Future government expenditures, (2) 
orders for capital goods, (3) 
(4) consumer 
goods, 


new 
inventories, 
expenditures on durable 
(5) construction and housing, and 
(6) corporate profits. He also spoke of 
the need for more regional data and more 
timely release of 


data bearing on net 


foreign investment. 


A United States Congressman, speaker at 
the September 30 luncheon session, explain- 
ed that he worked for increases in the sta 
tistical budget even though a member of 
the “economy block,'” because he believes 
that Congress needs more adequate sta- 
tistics if it is to function effectively. He 
urged the FSUC to make a critique of the 
statistical materials in each year's Economic 
Report, and said that it should do more to 
bring the need for better statistical infor- 
mation to the attention of Congress. “We 
have people in Congress who would help 
to get better statistics. We 
told what is needed.” 


need to be 


Six round table discussions dealt with: 
(1) Interindustry Purchases and Sales: A 
Fool of Many Uses; (2) Statistical Report 
ing of Federal Government 
Wctivities: Is It Adequate?; 
Revisions in Major Economic 
National Product 
Board Industrial Production Index; 
(4) Distribution Statistics and Their 
Geographic Breakdown; (5) New Programs 
of Wage and Productivity Statistics: Uses 
and Problems; and (6) Statistics of Income: 
Recent Advances and Future Prospects. 


Procurement 
(3) Recent 
Indicators: 
and Federal Re 


Gross 


serve 


New trustees were chosen at the meeting 


to represent business, farm, labor and 
nonprofit organizations, and officers were 
elected by the new board. 


Noticias ESTADÍSTICAS 
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cia fue mavor que en cualquiera de las 
reuniones anuales anteriores. Más de 100 
usuarios no gubernamentales de estadísticas 
federales y 60 huéspedes de agencias fe 
derales que producen estadísticas partici 
paron en las varias sesiones 

El vicepresidente del Banco Chase Man- 
hattan, hablando en la sesión almuerzo 
del 29 de septiembre, rindió tributo al 
desarrollo de las estadísticas federales du- 
rante los últimos 30 años, pero hizo notar 
la necesidad de reducir áun más el “área 
de conjetura.'” El vió la necesidad de 
mejor información sobre” (1) Gastos gu- 
bernamentales futuros; (2) nuevos pedidos 
de bienes de capital; (3) inventarios; (4) 
gastos de los consumidores en bienes du- 
raderos; (5) construcción y vivienda; y (6) 
ganancias de las sociedades anónimas. 
También habló de la necesidad de más 
datos regionales y de la publicación, en 
momento más oportuno, de los datos sobre 
las inversiones netas extranjeras. 


Un diputado estadounidense, que habló 
en la sesión almuerzo del 30 de septiembre, 
explicó que él trabajaba para obtener un 
aumento en el presupuesto estadístico, a 
pesar de ser miembro del “bloque de la 
economía,'” porque creía que el Congreso 
requiere estadísticas más adecuadas si ha 
de funcionar efectivamente. Urgió a la 
FSUC la confección de una crítica de los 
materiales estadísticos en el Informe Eco- 
nómico anual, y dijo que debería hacer 
más para llevar a la atención del Congreso 
la necesidad de mejor información esta- 
dística. “Tenemos personas en el Congreso 
que avudarían a obtener mejores estadís- 
ticas. Necesitamos que se nos diga lo que 
se requiere.” 

En seis conferencias de mesa redonda se 
trató sobre: (1) Compras y ventas entre 
industrias: Un instrumento de muchos 
usos; (2) información estadística de las 
actividades de adquisiciones del Gobierno 
Federal: Es adecuada?; (3) Revisiones re- 
cientes de los principales indicadores eco- 
nómicos: Producto nacional bruto y el 
índice de producción industrial de la Junta 
de la Reserva Federal; (4) estadísticas de 
distribución y su descomposición geográfi- 
ca; (5) nuevos programas de estadísticas de 
salarios y productividad: Usos y problemas; 
y (6) estadísticas de ingresos: Adelantos 
recientes y perspectivas futuras. 

En la reunión se eligieron nuevos fidei- 
comisarios para representar a las organiza- 
ciones comerciales, agrícolas, sindicales y 
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A Long-Term Program for the Improve- 
ment of Federal Construction Statistics was 
submitted by the Conference on October 
16, 1959 to the Director of the Bureau of 
The 


the Budget. 


report results from a 


survey of user needs for better construction 


statistics made by the Conference during 
the past year. Over 200 users participated 


in preparation of the report, which is 
described as “a comprehensive, yet econom- 
ical program for the long-term improve- 
ment of Federal statistics,” 
A limited supply of copies is available. 
Requests should be sent to the Federal 
Statistics Users” 1420 New 
York Avenue, Washington, D.C. (Source: 
Roye Lowry, FSUC, Washington, D.C., 
October 1959.) 


construction 


Conference, 


The Compilation of 
Manufacturing Statistics 


e A comprehensive description of the 
whole process of compiling statistics on 
manufacturing—from the determination of 
program content through the collection 
and processing of the data to the final 
publication and distribution of the results— 
has been published by the United States 
Bureau of the Census in a volume entitled 
The Compilation of Manufacturing Sta- 
tistics, which was prepared under a contract 
with the Bureau by Frank A. Hanna, 
Professor of Economics at Duke University, 
in Durham, North Carolina, who formerly 
served for a number of vears as adviser on 
program planning in the Buraeu's Industry 
Division. The need for a comprehensive 
up-to-date treatment of this subject had 
been recognized for time by the 
Bureau of the Census, to supplement and 
integrate the information given in notes, 
definitions, and  appendixes  ordinarilv 
included with published statistics and to 
augment other available documentation on 
conceptual and procedural aspects of 
manufacturing statistics. Dr. Hanna's book 
is designed to serve such needs, which have 
been expressed by users of Census data in 
trade associations, universities 2nd research 
organizations, and government agencies in 
this country and abroad, as well as by 


some 
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no lucrativas, y la 
las autoridades. 


nueva junta eligió a 


A Long-Term Program for the Improve- 
ment of Federal Construction Statistics, fue 
presentado por la Conferencia al Director 
de la Dirección del Presupuesto el 16 de 
octubre de 1959. El informe es el resultado 
de una encuesta efectuada por la Confe- 
rencia durante el año pasado sobre las ne- 
cesidades de los usuarios de mejores esta- 
dísticas de la construcción. Más de 200 
usuarios participaron en la confección del 
informe, el cual es descripto como “un 
programa amplio pero económico para el 
mejoramiento a largo plazo de las estadís- 
ticas federales de la construcción.” Se dis- 
pone de una cantidad limitada de copias, 
y las solicitudes deberán ser enviadas a la 
“Federal Statistics Users” Conference, 1420 
New York Avenue. Washington, D.C.” 
(Fuente: Roye Lowry, FSUC, Washington 
D.C., octubre 1959.) 


La compilación de estadísticas 
industriales 


e Una amplia descripción de todo el pro- 
ceso de compilación de las estadísticas in- 
dustriales—desde la determinación del con- 
tenido del programa, a través de la reco- 
lección y procesamiento de los datos hasta 
la publicación final y distribución de los 
resultados—ha sido publicada por la Di- 
rección del Censo de los Estados Unidos 
en un volumen titulado The Compilation 
of Manufacturing Statistics que fué pre- 
parado, bajo contrato con la Dirección, por 
el Dr. Frank A. Hanna, Profesor de Eco- 
nomía de la Duke University, en Durham, 
North Carolina, quien anteriormente sir- 
viera, durante varios años, como consejero 
sobre planeamiento de programas en la 
División de Industrias de la Dirección. 
Desde hace algún tiempo, la Dirección del 
Censo reconoció la necesidad de contar con 
un amplio y moderno tratado sobre esta 
materia, para suplementar e integrar la 
información dada en notas, definiciones y 
apéndices, generalmente incluídos en las 
estadísticas publicadas y aumentar otra do- 
cumentación disponible sobre aspectos con- 
ceptuales y de procedimientos de las esta- 
dísticas industriales. El libro del Dr. Hanna 
está destinado a satisfacer estas necesida- 
des, como fuera expresado por los usuario» 
de datos censales de las asociaciones de co- 
mercio, universidades y organizaciones in- 
vestigadoras, y agencias gubernamentales en 
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technicians and other engaged in compiling 
data in this field or in training personnel 
for such work. 


In the preparation of this book, Dr. 
Hanna had access to source documents and 
internal working memoranda of the Bureau 
of the Census, to special data compilations 
required for the purpose, and to advice 
and comments of members of the Bureau 
staff, with many of whom he engaged in 
extensive discussion 
subjects covered. 


and consultation on 


The opening chapter reviews the scope 
and organization of manufacturing industry 
in the United States and the need for and 
availability of manufacturing statistics. The 
next five chapters describe some of the 
tools which have developed for 
obtaining statistical data on manufacturing, 
and include discussion of alternative ways 
of measuring manufacturing activity, results 
of research on the types of information 
available in manufacturers' records, meth- 
ods of classifving industry and product, 
and publication policies (including avoid- 
ance of disclosure of confidential informa- 
tion). The succeeding five chapters are 
devoted explicitly to processes involved in 
the collection, preparation, tabulation and 
publication of data, including steps from 
the preparation of a directory of manu- 
facturers to practices in the distribution 
of published results. The final chapter 
considers implications for 
industrial statistics. 


been 


programming 


Copies of The Compilation of Manufac- 
turing Statistics (233 pages, cloth-bound) 
mav be purchased at $1.75 (U.S.) each 
the Superintendent of Documents, 
Government Printing Office, Washington 
25, D.C. (Source: Maxwell R. Conklin, 
Bureau of the Census, Washington, D.C. 
November 1959.) 


from 


BLS price revision project 


e The United States 
Statistics (BLS) has 

project of revising its consumer price 
indexes and related statistics. Funds for 
the first year of this program were included 
as a separate item in the 1960 budget. The 


of Labor 
begun a five-year 


Bureau 
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el país y del extranjero, así como también 
por técnicos y otras personas ocupadas en 
la compilación de datos en este campo o 
en el entrenamiento de personal para ese 
trabajo. 


En la preparación de este libro, el Dr. 
Hanna, tuvo acceso a fuentes documentales 
y memorandums de trabajos internos de la 
Dirección del Censo, a compilaciones es- 
peciales de datos requeridos para este pro- 
pósito, y a los consejos y comentarios de 
miembros del cuerpo de la Dirección, con 
muchos de los cuales sostuvo extensas dis- 
cusiones y consultas sobre los temas abar- 
cados. 


En el primer capítulo se analizan el al- 
cance y la organización de la industria 
manufacturera en los Estados Unidos y. la 
necesidad y disponibilidad de estadísticas 
industriales. Los cinco capítulos siguientes 
describen algunas de las herramientas que 
han sido desarrolladas para obtener datos 
estadísticos industriales, e incluyen dis- 
cusiones de sistemas alternativos para medir 
la actividad industrial, resultados de las 
investigaciones en los tipos de información 
disponible en los registros industriales, mé- 
todos para clasificar industrias y productos 
y políticas de publicación (incluyendo el 
acto de evitar la revelación de informacio- 
nes confidenciales). Los cinco capítulos 
sucesivos están dedicados, explícitamente, a 
los procesos relacionados con la recolección, 
preparación, tabulación y publicación de 
datos, que incluyen desde la preparación 
de una lista de industriales hasta las prác- 
ticas para la distribución de los resultados 
publicados. En el capítulo final se pre- 
sentan opiniones para la programación de 
estadísticas industriales. 


Copias de The Compilation of Manufac- 
turing Statistics (233 págs. en tela), pueden 
adquirirse a $1,75 (U.S.) cada una en la 
“Superintendent of Documents, Government 
Printing Office, Washington 25, D.C.” 
(Fuente: Maxwell R. Conklin, Dirección 
del Censo, Washington, D.C., noviembre, 
1959.) 


Plan de revisión del índice 
de precios del BLS 


e La Dirección de Estadísticas del Tra- 
bajo de los Estados Unidos (BLS), ha 
comenzado el plan quinquenal de revisión 
de sus índices de precios al consumidor y 
de estadísticas relacionadas. Los fondos 
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project will give primary emphasis to the 
preparation of a revised Consumer Price 
Index (CPI), which BLS expects to publish 
in January 1964. For this purpose up-to- 
date obtained on 


information will be 


consumer means of a 


comprehensive survey of cities throughout 


expenditures by 


the country, and this information will also 
be used to revise other BLS statistical data, 
such as the city worker familv budget. 


At the request of the Bureau of the 
Budget, the National Bureau of Economic 
Research (NBER) has agreed to “undertake 
a review of the Federal Government's sta- 
tistical programs dealing with prices and 
price index make recom- 
mendations concerning improvements and 


numbers and 


additions which may 


be needed for more 


effective analysis.”” This review will include 
in its scope the BLS Consumer Price Index 
and the price collections related to it 
useful for other purposes. In 
addition BLS plans to bring together a 
professional group to review its plans for 
the consumer expenditure survey, which is 
not specifically included in the NBER 
review. Within the U.S. Government, the 
Office of Statistical Standards, Bureau of 
the Budget, will also review the project 
and will obtain the professional advice of 
interested Federal agencies. 


which are 


Dwelling-unit and consumer expenditure 
surveys. 


Before the revision project can 
begin, it will be necessary for the BLS to 
determine definitely the cities for which 
the revised CPI is to be computed. 
this determination is not yet 
final, it is expected that the mumber of 
cities will not be more than 70 for the 
expenditure surveys and about 50 for price 
data collection. 


Although 


These numbers compare 
with 97 cities for which expenditure data 
were collected in the 1950 revision, and 46 
cities for which price data are collected 
currently to produce the CPI for the 
United States. 


The first basic phase of the revision pro- 
ject will be a survey of dwelling units in 
each of the expenditure-survey cities. One 
half of the cities will be surveyed in the 
autumn of 1960 and the remaining half in 


IASI, EstabísTICA, DICIEMBRE 1959 


para el primer año de este programa fueron 
incluídos como un item separado en el 
presupuesto de 1960. El plan dará énfasis 
principal a la preparación del Indice Re 
visado de Precios al Consumidor (CPI) que 
el BLS espera publicar en enero de 1964. 
Para este fin se obtendrán informaciones 
de todo el país, y esta información será 
utilizada también para rever otros datos 
estadísticos del BLS tales como el presu- 
puesto familiar del trabajador urbano. 

A pedido de la Dirección del Presupues- 
to, el Departamento Nacional de investiga- 
ción Económica (NBER), ha acordado lle- 
var a cabo una revisión de los programas 
estadísticos del Gobierno Federal que tratan 
de precios y números índices de precios, 
v hacer recomendaciones con respecto a las 
mejoras y a las adiciones que pueden ser 
necesarias para un análisis más efectivo. 
Esta revisión incluirá, dentro de su alcance, 
al Indice de Precios al Consumidor del 
BLS y al conjunto de precios relacionados, 
que sea útil para otros fines. Además, el 
BLS proyecta formar un grupo profesional 
para revisar sus planes para la encuesta 
sobre gastos de los consumidores, que no 
está específicamente incluída en la revisión 
del NBER. Dentro del Gobierno de los 
Estados Unidos, la Oficina de Estándares 
Estadísticos, Dirección del Presupuesto, 
también revisará el plan y obtendrá el 
asesoramiento profesivnal de las reparticio- 
nes federales interesadas. 


Encuestas sobre gastos de los consumido- 
res y sobre unidades de vivienda. Antes de 
que pueda comenzar el plan de revisión, 
será necesario que el BLS determine, defi- 
nitivamente, las ciudades para las cuales 
se ha de calcular el CPI revisado. Aunque 
esta determinación no es todavía final, se 
espera que el número de ciudades no será 
superior a 70 para las encuestas sobre gas- 
tos, y alrededor de 50 para la recolección 
de datos sobre precios. Este número se 
compara con las 97 ciudades para las cuales 
se reunieron datos sobre gastos en la revi- 
sión de 1950, y con las 46 ciudades para 
las cuales se reunen actualmente datos para 
calcular el CPI de los Estados Unidos. 


La primera fase básica del plan de revi- 
sión será una encuesta sobre las unidades 
de vivienda en cada una de las ciudades 
comprendidas en la encuesta sobre gastos. 
La mitad de las ciudades será tomada para 
la encuesta en el otoño de 1960, y la otra 
mitad en el otoño de 1962. Las encuestas 
sobre unidades de vivienda llenarán dos 
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1962. The 
surveys serve two major purposes: 


the autumn of dwelling-unit 
They 
provide in each city a typical sample of 

units used in the 
consumer expenditure survey for that city, 
and they provide up-to-date samples of 
dwelling units for the BLS survey of rents 


dwelling which is 


which is part of its pricing program. 

Fhe second phase of the project will be 
the consumer expenditure survey itself 
In this phase also the sample will be split. 
Those cities for which dwelling-unit surveys 
are made late in 1960 will be survered 
for consumer expenditures in January to 
March 1961. The remaining cities will be 
surveyed in January to March 1962. BLS 
is planning to make each sample independ- 
ent and representative, and the 
groups of cities will be formed with this 
objective in mind. Very large cities will 
be split, and one half will be allocated to 
each sample. The BLS is planning a pilot 
survey of consumer expenditures in a “lead 
city”” (Cincinnati) in carly 1960. 


two 


Revision of weights for consumer price 
indexes. As the first step in the compu- 


tation of revised weights, the survey 
schedules for families of wage earners and 
clerical workers will be separated from the 
other survey schedules for each city and 
their expenditures will be analyzed. In 
the 1950 revision the families selected in 
this manner were those which consisted of 
at least two persons living in towns or 
cities of 2500 or more population, whose 
heads of family were wage earners or 
salaried clerical workers and whose family 
income (including the income of all earners 
in the family) did not exceed $10,000. The 
income cut-off of $10,000, used in 1950, 
was primarily a technical device intended 
as a check on the correctness of the oc- 
cupational classifications reported in the 
expenditure-survey interviews. This crite- 
modified in the 
terms of 


however, the 


rion may be current 


revision. In coverage of the 
BLS 1s not 
considering a change in the concept of the 
CPI, and the index, according to present 
plans, will continue to relate to families 
of wage earners and clerical workers in 


urbanized areas. 


population, 
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fines principales: Proporcionarán, para cada 
ciudad, un ejemplo típico de las unidades 
de vivienda que se utilizan en la encuesta 
sobre gastos de cada ciudad, y proveerán 
muestras “al día'* de las unidades de vi- 
vienda para la encuesta del BLS sobre 
alquileres, que forma parte de su programa 
de precios. 

La segunda fase del plan será la encuesta 
sobre los gastos de los consumidores en sí. 
También en esta fase se dividirá la mues- 
tra. Para aquellas ciudades en las que se 
hicieron encuestas sobre vivienda a fines de 
1960, se harán encuestas sobre gastos de los 
consumidores desde enero a marzo de 1961. 
En las demás ciudades se harán encuestas 
de enero a marzo de 1962. El BLS proyecta 
hacer cada muestra independiente y repre- 
sentativa, v los dos grupos de ciudades serán 
formados teniendo presente este objetivo. 
Las ciudades muy grandes serán divididas 
y la mitad será asignada a cada muestra. 
El BLS proyecta una encuesta piloto en 
una “ciudad importante” (Cincinnati) a 
principios de 1960. 


Revisión de ponderaciones para los indi- 
ces de precios al consumidor. Como primer 
paso para el cálculo de las ponderaciones 
revisadas, las planillas de las encuestas para 
las familias de los obreros y de los em- 
pleados serán separadas de las otras pla- 
nillas de las encuestas para cada ciudad y 
analizados sus gastos. En la revisión de 
1950, las familias seleccionadas en esta for- 
ma fueron las integradas al menos por dos 
personas que vivían en pueblos o ciudades 
de 2500 o más habitantes, cuvos jefes de 
familia eran obreros o empleados a sueldo 
y cuyo ingreso familiar (incluyendo el 
ingreso de todos los trabajadores de la fa- 
milia) no excedían los $10.000.—U.S. El 
límite de ingresos a $10.000.—U.S. utili- 
zado en 1950, fué principalmente un re- 
curso técnico para controlar la corrección 
de las clasificaciones ocupacionales denun- 
ciadas en las encuestas sobre gastos. Este 
criterio, puede ser modificado en la revisión 
corriente. Sin embargo, en términos de 
cobertura de la población, el BLS no está 
considerando un cambio en el concepto del 
CPI, y de acuerdo con los planes presentes, 
el índice continuará relacionado con las 
familias de obreros y empleados de áreas 
urbanizadas. 


La deducción de las ponderaciones para 
el CPI en las ciudades no será un cálculo 
simple a partir de los gastos de las familias 
del índice tipo como se muestra en las 
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The derivation of weights for the city 
CPI will not be a straight computation 
from the expenditures of the index-type 
families as shown in the city surveys. It 
is expected that the adjustments to the 
reported expenditures in the current revi- 
sion project will be similar to those made 
in the 1950 revision. 

Revision of price collection and related 
procedures. The Bureau of Labor Statis- 
tics is now engaged in drawing up plans 
for the reexamination and revision of its 
pricing procedures. This study will include 
the re-examination and possible modifica- 
tion of the criteria for selecting items to 
be priced, and a re-study of the relatioships 
between prices of different commodities. 
The latter are of extreme importance since 
they form the basis for imputing the price 
movements of a priced commodity to others 
for which actual prices are not collected. 
The revised price data will, of course, be 
used in the CPI, and for the direct publica- 
tion of price averages. 

In the collection of data on rental costs, 
a subsidiary use is made of the compre- 
hensive dwelling-unit survey described 
above. In survey cities for which average 
rents to be collected, a sample of “rental” 
«dwelling units is selected from the 
comprehensive list of awelling units. This 
“rent sample”? will serve as the basis for 
the BLS continuing program of estimating 
monthly changes in average rents. 

Supplemental products of the revision 
project. Since the expenditure surveys in 
the 70 cities will furnish a cross section 
of the entire urban population (including 
single consumers and others not covered 
hy the CPI), data on average expenditures 
for the urban population and various 
categories can be obtained. As these surveys 
represent the chief source of comprehensive 
data on urban expenditures in the United 
States, the data will be in demand par- 
ticularly for general economic and market 
analysis. Plans have not been completed, 
but budget provision has been made for 
tabulations of this type and the BLS plans 
to publish the data in detail. 

Revisions of the  city-worker 
budget and the elderly couple budget 
involve much analytical work and the 
utilization of many other sources. Never- 


family 


IASI, EsTADÍSTICA, DICIEMBRE 1959 


encuestas de las ciudades. Se espera que los 
ajustes a los gastos denunciados en el 
provecto de revisión corriente serán simi- 


lares a los que se hicieron en la revisión 
de 1950. 


Revisión de la recolección de precios y 
procedimientos análogos. La BLS está 
actualmente ocupada en la confección de 
los planes para reexaminar y revisar sus 
procedimientos de fijación de precios. Este 
estudio incluirá un nuevo examen y la po- 
sible modificación del criterio a seguir para 
la selección de los items que deben ser 
estimados, y un nuevo estudio de las rela- 
ciones entre los precios de diferentes artí- 
culos. Los últimos son de extrema impor- 
tancia ya que forman las bases para impu- 
tar los movimientos de precios de un 
artículo a otros, para los cuales no se reu- 
nen los precios reales. Naturalmente, se 


utilizarán los datos de los precios revisados 
en el CPI y en la publicación directa de 
los precios medios. 


En la recolección de datos sobre costos de 
los alquileres, se hace uso subsidiario de la 
encuesta comprensiva de las unidades de 
vivienda que se ha descripto anteriormente. 
En las ciudades de la encuesta para las 
cuales serán reunidos alquileres medios, se 
selecciona una muestra de unidades de 
vivienda de la lista completa de las unida- 
des de vivienda. Esta “muestra de alqui- 
leres”” servirá de base al programa contínuo 
del BLS para la estimación de los cambios 
mensuales en el promedio de los alquileres. 


Productos suplementarios del plan de 
revisión. Ya que las encuestas en las 70 
ciudades proveerán un corte transversal de 
toda la población urbana (incluyendo con- 
sumidores aislados y otros no cubiertos por 
el CPI), se pueden obtener datos sobre el 
término medio de los gastos de toda la 
población de varias categorías. Como estas 
encuestas representan la fuente principal 
de datos completos, sobre gastos urbanos 
en los Estados Unidos, los datos serán re- 
queridos particularmente para el análisis 
general económico y del mercado. Aún no 
se han completado los planes, pero el pre- 
supuesto hace provisión para las tabulacio- 
nes de este tipo y el BLS proyecta publicar 
los datos en detalle. 

La revisión del presupuesto familiar del 
trabajador urbano y el del matrimonio de 
edad madura, involucra mucho trabajo 
analítico y la utilización de otras fuentes 
de información. Sin embargo, las encuestas 
sobre gastos proveerán materiales básicos 
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theless, the expenditure surveys will furnish 
the basic materials for the analysis of these 
budgets and their probable revision. These 
revisions, although it is mot possible to 
indicate their dates of completion, form a 
definite part of the revision project. 

The surveys will also furnish basic data 
for numerous studies by the BLS and other 
agencies on comparisons of expenditure 
patterns between different localities and 
other topics. 

Chronology of the revision program. 
Present plans call for the following chron- 
ology of the various phases of the revision 
project: Fiscal year 1960—Devoted primarily 
to planning, with a pilot survey of consum- 
er expenditures in one “lead city” — 
Cincinnati. Under a special authorization 
of funds, expenditure surveys and price 
work in Alaska will be coordinated with 
the price revision project. Fiscal year 
1961—Dwelling-unit surveys and surveys of 
consumer expenditures in approximately 
half of the survey cities, with certain large 
cities covered in both 1961 and 1962 in 
order to permit each sample to be a 
representative cross section of urban United 
States. Fiscal year  1962—Dwelling-unit 
surveys and surveys of consumer expendi- 
tures in the remaining half of the survey 
cities. Fiscal year 1963—Computation of 
weights and trial indexes. Fiscal year 
1964—Publication of the revised CPI plan- 
ned for January 1964, and dual publication 
of indexes on both the old and the revised 
bases for January through June 1964. 
(Source: Thomas F. Mosimann, Bureau of 
the Budget, Washington, D.C., October 
1959.) 


Recent BLS prices and 
cost-of-living bulletins 


e The Division of Prices and Cost of 
Living of the United States Bureau of 
Labor Statistics (BLS) has recently publish- 
ed the following bulletins: 

Retail Prices of Food, 1957-58, BLS Bul- 
letin No. 1254 (37 p. $0.30—U.S.). This 
regular biennial publication provides 
extensive BLS data on retail food prices 
in convenient summary form for the 
general public and other users of the data. 
Many of the statistics were published 
originally in one of two BLS monthly 
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para el análisis de estos presupuestos y de 
su probable revisión. Aunque no es posible 
indicar las fechas en que se completarán 
estas revisiones, ellas forman parte defini- 
tiva del programa de revisión. 

Las encuestas también suministrarán da- 
tos básicos para numerosos estudios del 
BLS y de otras oficinas sobre comparacio- 
nes de diseños de gastos entre diferentes 
localidades y otros tópicos. 

Cronología del plan de revisión. Los 
planes actuales establecen las siguientes fe- 
chas para las distintas fases del plan de 
revisión: Año Fiscal 1960—Dedicado prin- 
cipalmente a la planificación, con una 
encuesta piloto sobre gastos de los consu- 
midores en una “ciudad principal”, Cin- 
cinnati. Por la autorización especial de 
fondos, las encuestas sobre gastos y precios 
del trabajo en Alaska será coordinada con 
el plan de revisión de precios. Año Fiscal 
1961—Encuestas sobre unidades de vivienda 
v encuestas sobre gastos de los consumido- 
res en, aproximadamente, la mitad de las 
ciudades sometidas a encuestas, con algunas 
ciudades grandes tomadas en 1961 y 1962, 
a fin de permitir que cada muestra sea 
un corte transversal urbano representativo 
de los Estados Unidos. Año Fiscal 1962— 
Encuestas sobre viviendas y encuestas sobre 
gastos de los consumidores en la segunda 
mitad de las ciudades sometidas a encues- 
tas. Año Fiscal 1963—Cálculo de pondera- 
ciones e índices experimentales. Año Fiscal 
1964—Publicación del CPI revisado, proyec- 
tado para enero de 1964, y publicación dual 
de los índices sobre las bases antigua y 
revisada, de enero a junio de 1964. (Fuen- 
te: Thomas F. Mosimann, Dirección del 
Presupuesto, Washington D.C., octubre 
1959.) 


Boletines recientes del BLS sobre 
precios y costo de vida 


e La División de Precios y Costo de Vida 
de la Dirección de Estadísticas del Trabajo 
de los Estados Unidos (BLS), ha publicado 
recientemente los siguientes boletines: 


Retail Prices of Food, 1957-58. Boletín 
del BLS No. 1254 (37 págs. $0,30 U.S.). 
Esta publicación regular bienal contiene 
cuantiosos datos del BLS sobre los precios 
al por menor de los alimentos, en forma 
convenientemente resumida para el público 
en general y para otros usuarios de los 
datos. Muchas de las estadísticas fueron 
publicadas originalmente en uno de los 
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reports, The Consumer Price Index and 
Retail Food Prices by Cities. The bulletin 
also contains an analysis of price move- 
ments for food during 1951 and 1958, a 
technical section describing the index 
procedures, and historical tables of prices 
and indexes for groups, subgroups, and 
items for the United States and 20 large 
cities. 

Consumer Prices in the United States, 
1953-58, BLS Bulletin No. 1256 (126 p. 
$0.65—U.S.) This bulletin continues the 
series of such historical records covering 
the years from 1913 forward. It contains 
an analysis of price movements of consumer 
goods and services during the 6—year 
period, 1953-58; a section describing the 
history and development of the Consumer 
Price Index (CPI); a section discussing 
various technical aspects of the CPI; and 
tables of indexes for the years 1953-58 and 
earlier for the United States citv average 
and each of the 20 large cities, as well as 
data which have appeared in the many 
individual monthly CPI reports and articles 
in the Monthly Labor Review. 

Wholesale Prices and Price Indexes, 1958, 
BLS Bulletin No. 1257 (310 p. $1.50—U.S.) 
This bulletin is a new edition of a series 
which started in 1900, Much of the data 
has been published in monthly Wholesale 
Price Index (WPI) reports and in the 
Monthly Labor Review. The bulletin 
contains an analysis of price movements of 
primary market prices during 1958; a brief 
description of the WPI; and tables of 
indexes and prices for the year 1958. 

Copies of the BLS bulletins may be 
obtained at the prices indicated from the 
Superintendent of Documents, Government 
Printing Office, Washington 25, D.C. 
(Source: Sidney A. Jaffe, BLS, Washington, 
D.C., November 1959.) 


National automobile use survey 


e The United States Bureau of the Census 
is conducting a survey for the Bureau of 
Public Roads to obtain nationwide infor- 
mation on private automobile use to aid 
in developing plans for the administration, 
improvement and maintenance of the 
national highway network. The informa- 
tion will be obtained for a 10-day period 
dos informes mensuales del BLS, The 
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Consumer Price Index y Retail Food Prices 
by Cities. El boletín contiene también un 
análisis del movimiento de los precios de 
los alimentos durante 1957 y 1958, una 
sección técnica que describe la metodología 
de los índices, y cuadros cronológicos de 
precios e índices por grupos, subgrupos e 
items para los Estados Unidos y 20 grandes 
ciudades. 

Consumer Prices in 
1953-58. Boletín No. 
págs. $0,65 U.S.). Este boletín continúa 
la serie de informaciones cronológicas 
cubriendo desde el año 1913 en adelante. 
Contiene un análisis del movimiento del 
precio de los artículos de consumo y de 
los servicios durante el período de 6 años 
1953-58; una sección que describe la his- 
toria y el desarrollo del Indice de los Pre- 
cios al Consumidor, (CPI); una sección 
que trata de los distintos aspectos técnicos 
del CPI; y cuadros de índices para los 
años 1953-58 y años anteriores, para el pro- 
medio de las ciudades de los Estados Uni- 
dos y para cada una de las 20 ciudades más 
grandes, como también datos que han apa- 
recido en muchos informes mensuales del 
CPI y en artículos de la Monthly Labor 
Review. 

Wholesale Prices and Price Indexes, 1958. 
Boletín No. 1257 del BLS (310 págs. $1,50 
U.S.). Este boletín es una nueva edición 
de una serie que comenzó en 1900. Gran 
parte de los datos han sido publicado en 
informes mensuales del Wholesale Price 
Index (WPTD y en la Monthly Labor 
Review. El boletín contiene un análisis del 
movimiento de precios durante 1958; una 
breve descripción del WPI y cuadros de 
índices y precios para el año 1958. 

Se pueden obtener copias de estos bole- 
tines a los precios indicados de “Superin- 
tendent of Documents, Government Print- 
ing Office, Washington 25, D.C.” (Fuente: 
Sidney A. Jaffe, BLS, Washington, D.C., 
noviembre 195%.) 


the United States, 
1256 del BLS (126 


Encuesta nacional sobre el 
uso del automóvil 


e La Dirección del Censo de los Estados 
Unidos está llevando a cabo una encuesta 
para la Dirección de Caminos Públicos, 
con el fin de obtener información, de al- 
cance nacional, sobre el uso del automóvil 
privado, como ayuda para el desarrollo de 
los planes de administración, mejora y 
mantenimiento de la red nacional de carre- 





STATISTICAL NEWS — 


in late September and early October 1959, 
and will be collected by personal interview 
with about 4,000 households in an 
going Current 
Population Survey. Other relevant informa- 
tion 


out- 


rotation panel for the 


previously collected for the 


households in the 


same 
Current Population 
Survey will be utilized in tabulating and 
analyzing the results. 

The primary purpose of the survey is to 
obtain data on the number of trips and 
vehicle miles, classified by reason for and 
length of trip. The information will be 
collected by two interviews at each house- 
hold, supplemented by the keeping of logs. 
The first interview will obtain a descrip 
tion of the automobile, its annual mileage 
and estimated gasoline consumption, and 
a record of trips during a specified preced- 
ing 3-day period based on personal recall. 
A report form will be left for each auto 
mobile owned by persons in the household, 
for a request that a log of trips be kept 
for a subsequent specified 3 davs. At the 
end of that time, the second interview will 
be held to pick up the log and (if neces 
sary) reconstruct the trips on the second 
3-day period. This procedure will give a 


6-day record for each household. (Source: 


Donald E. Church, Bureau of the Census, 
Washington, D.C., September 1959.) 


Bone tumor study 
in Illinois hospitals 


e The National Office of Vital Statistics, 
United States Public Health Service, in 
collaboration with the Argonne National 
Laboratory, will conduct a bone tumor 
study in Illinois hospitals during September 
and October 1959, The survey will be 
conducted by mail with provisions for ap- 
propriate mail and telephone follow-up to 
reduce nonresponse. A!i 325 hospitals listed 
in the American Hospital Association's 
Directory for Illinois, plus about 25 ad- 
ditional hospitals listed in the Director; 
of Hospitals and Accredited Schools of 
Nursing, State of Illinois, August 1958, will 
be covered in the survey. 
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teras. La información será obtenida para 
un período de 10 días a fines de septiembre 
y a principios de octubre de 1959, y me- 
diante entrevista personal en alrededor 
de 4.000 hogares censales, en una visita 
del panel rotativo para la Encuesta Corrien 
te de Población. Otras informaciones 
apropiadas, previamente reunidas para los 
mismos hogares censales en la Encuesta 
Corriente de Población, serán utilizadas en 


la tabulación y análisis de los resultados. 


La finalidad principal de la encuesta es 
la obtención de datos sobre el número de 
viajes y millas vehículo, clasificados por 
motivo y por la distancia del viaje. La 
información será recogida en dos entrevis- 
tas en cada hogar censal, suplementadas 
por el mantenimiento de un formulario 
para anotaciones diarias. En la primer en- 
trevista se obtendrá una descripción del 
automóvil, su kilometraje anual, el consu- 
mo estimado del combustible, y el detalle 
de los viajes durante un específico período 
precedente de 3 días, en 
personal. Se 


base a recuento 
dejará un formulario por 
cada automóvil propiedad de las personas 
del hogar censal, con un pedido de que 
se lleve un detalle de los viajes para un 
segundo período especificado de 3 
11 finalizar el período de días, se 
efectuará la segunda entrevista para reco- 
ger el formulario, y (si es necesario) hacer 
una reconstrucción de los viajes durante 
el segundo período de 3 días. Este proce- 
dimiento dará una información de 6 días 
para cada hogar censal. (Fuente: Donald 
E. Church, Dirección del Censo Washing 
ton, D.C., septiembre 1959.) 


días 
los 3 


Estudio en los hospitales de Illinois 
sobre tumores en los huesos 
e La Oficina Nacional de Estadística Vital 
del Servicio de Salud Pública de los Estados 
Unidos, en colaboración con el Laboratorio 
Nacional de Argonne, conducirá un estudio 
sobre tumores en los huesos, en los hospi- 
tales del Estado de Illinois, durante sep- 


tiembre y octubre de 1959. La encuesta 


se llevará a cabo por correo, con provisio- 


nes para entrevistas complementarias por 
correo y por teléfono, a fin de reducir la 
falta de respuestas. La encuesta cubrirá a 
los 325 hospitales que figuran en la lista, 
para llinois, de la Asociación de Hospitales 
Americanos, además de otros 25 hospitales 
que figuran en la lista de hospitales y 
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The major objectives of the survey are 
1) to describe the age and sex character- 
istics of patients hospitalized during 1958 
in Illinois with a discharge diagnosis of 
primary malignant neoplasm of the bone 
and (2) to determine the prevalence trends 
during 1953-58 of hospitalized cases of 
primary malignant neoplasm of the bone. 
This information would supplement what is 
known of the prevalence of such cases based 
upon mortality statistics. (Sources: Harry 
Auerbach, Argonne National Laboratory, 
Illinois; Monroe G. Sirken, Public Health 
Service DE, 
1959.) 


Washington, September 


IASI, EsTADÍSTICA, DICIEMBRE 1959 


Escuelas Acreditadas de Enfermería, Estado 
de Illinois, agosto de 1958, 

Los principales objetivos de la encuesta 
son (1) describir las características de edad 
* de sexo de los pacientes hospitalizados 
durante 1958 en Illinois, con diagnosis re- 
velada de neoplasma maligno primario del 
hueso; y (2) determinar las tendencias pre- 
valentes durante 1953-1958 de los casos hos- 
pitalizados con neoplasma maligno prima- 
rio del hueso. Esta información suplemen- 
tará lo que se conoce sobre la prevalencia 
en tales casos, basado en las estadísticas de 
mortalidad. (Fuentes: Harry Auerbach, 
Laboratorio Nacional de Argonne, Illinois; 
Monroe G. Sirken, Servicio de Salud Pú- 
blica, Washington, D.C. septiembre 1959.) 


URUGUAY 


Noticias per sonales 


e En la Dirección General de Estadística y Censos fueron nombrados jefes de depar- 
tamento, los siguientes funcionarios: Edison Wibmer, Departamento de Demografía; 
Bolivar Sozo, Departamento de Estadística Económica; Juan C. Sclavo, Departamento de 
Tabulación y Publicaciones; y Carlos H. Perera, Departamento de Administración. 


VENEZUELA 


1960 census program 


e The General Bureau of Statistics and 
National Censuses (DGECN) has released 
a series of documents related with the 1960 
census program. Series A includes the 
latest law authorizing the Census (see TASI 
Estadística No. 62, p. 185) and related 
legislation, a description of the background 
of the law, history of the census, and a 
preliminary calendar for preparations for 
and the taking of the censuses. 
includes technical references from interna- 
tional organizations and from private 
individuals; work programs for 
taking the maps, schedules and 
forms; series D, national technical reports; 
series E, proposed schedules and forms and 
instructions for population and related 
censuses; series F, instructions, laws, and 
documents concerning the agricultural and 
related censuses; series G, census publicity; 
series H, meetings of the Consultative 


Series B 


series C, 
census, 


Programa censal de 1960 


e La Dirección General de Estadística y 
Censos Nacionales (DGECN) ha preparado 
una serie de documentos relacionados con 
el programa censal de 1960. La serie A 
incluye la última ley que autoriza el censo 
(ver IASI Estadística No. 62, p. 185) y la 
legislación correspondiente; una descripción 
de los antecedentes de la ley, historia de 
los censos, y el calendario preliminar para 
la preparación y el levantamiento de los 
censos. La serie B, incluve referencias téc- 
nicas de las organizaciones internacionales 
y de particulares; la serie C, programas de 
trabajo para el levantamiento de los censos, 
mapas, cédulas y cuestionarios; la serie D, 
informes técnicos nacionales; la serie E, 
proyectos de cuestionarios, tarjetas e ins- 
trucciones para censos experimentales de 
población e investigaciones afines; la 
serie F, instrucciones, leyes y documentos 
relacionados con el censo agropecuario e 
investigaciones afines; la serie G, publicidad 
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Council; series I, activities and composition censal; la serie H, reuniones del Consejo 


of census committees; series J], report on Consuitivo; la serie 1, actividades + compo 


the status of the preparatory work for the “CIÓN de las comisiones censales; la 

1960 National Census, series K, lectures on 73€ J, informe sobre la situación de los 
» » | 

training of census workers; series M, organ trabajos preparatorios del Censo Nacional 

Epa de 1960; la serie K, conferencias para adies 

ization of cenmsus zones and list of 

geographic, demographic, economic, and 


social conditions of each census zone: 


tramiento del personal del censo; la 
serie M, organización de zonas censales y 
! : ] , , estudio de sus condiciones geográficas 
series X, meeting of sectional statistical económicas y sociales: la serie X. reuniones 
directors. (Sources: Documents on the 


de directores seccionales de estadística 
1960 Census Program, DGECN, Caracas 


Fuentes: Documentos sobre el Programa 
1959.) Censal de 1960, DGECN, Caracas, 1959.) 


Noticias personales 


e El Dr. José M. Avilán, médico adjunto a la División de Epidemiología Departamento 
de Demografía y Epidemiología, Ministerio de Sanidad y Asistencia Social, Caracas, asiste 
desde septiembre de 1959, a un curso de entrenamiento en epidemiología en la Columbia 
University (E.U.A.), con beca otorgada por el Gobierno de Venezuela 


e El Dr. Fayad Camel-Vargas, médico epidemiólogo, División de Epidemiología y Esta 
dística Vital, Ministerio de Sanidad v Asistencia Social, Caracas, asiste a la Columbia 


University (E.U.A.), desde abril de 1959 para hacer un curso de entrenamiento de dos 
años en estadística vital, becado por el Gobierno de Venezuela 

e El Sr. Eric Michalup, profesor, Escuela de Ciencias Estadísticas y Actuariales, Univer 
sidad Central de Venezuela, fue elegido, en el mes de noviembre de 1959, miembro titular 
del Instituto Internacional de Estadística 





PUBLICATIONS — PUBLICACIONES 


BIBLIOGRAPHY — BIBLIOGRAFÍA 


This bibliography is a quarterly supplement Esta bibliografía es un suplemento trimestral 
to the JASI Bibliograbhy of Selected Statistical 4 la Bibliografía de Fuentes Estadísticas Escogi 
Sources of the American Nations, May 1947. 1 as de las Naciones 1mericanas, mayo de 1947, de 
includes statistical material drawn from journals IASI. Incluye materiales estadísticos obtenidos de 
las revistas, y de publicaciones oficiales de las 
que se recibió noticia en las respuestas a los 
cuestionarios trimestrales de I1ASI, y publicacio 
nes de otros orígenes. La clasificación está hecha 
en los siguientes amplios grupos de materias: Ge 
neral; censo; ciencia estadística; geografía; demo 
nomics; health and cultural statistics; govern grafía; economía; estadísticas de salubridad y 
ment and political statistics; labor and living cultura; estadísticas gubernamentales y políticas; 
conditions [he call numbers used in the condiciones de trabajo y de vida. Los números 
1947 Bibliography, composed of the abbr indicadores que se usaron en la Bibliografía edi- 
viations of the country concerned (or of Interna tada en 1947, formados por la abreviatura del 
país correspondiente (o Internacional o No 
Geográfico) y el número decimal de la materia, 
aparecen entre parentesis al final de cada re 
ferencia. Los números indicadores que siguen a 
continuacion de artículos aparecidos en publi 
publication caciones periódicas son los de la publicación 


and official publications reported in response to 
quarterly questionnaires and publications from 
other sources The classification is bvy the 
following broad subject groups: General; census 
statistical science; geography; demography; eco 


tional or Non Geographic) and the decimal sub 
ject number, are given in parentheses following 
each entry The call numbers following articles 
contained in periodicals are those of the 


GENERAL 


Guat Guatemala en Cifras, 1958. (Guatemala, 1959.| Dirección General de Estadística 
169 p. (Guat-1410) 


Contenido: Geografía; demografía; agricultura; ganadería; producción y con 
sumo industriales; transportes; comercio internacional; índice de precios; estadística 
fiscal; moneda y banca; balanza de pagos e ingreso nacional; seguros; estadísticas 
sociales y culturales; estadísticas hospitalarias; estadísticas del trabajo y seguridad 
social 


Hond Anuario Estadístico, 1957. Yegucigalpa, D.C., 1959. Dirección General de Esta 
dística y Censos. 386 p. (Hon-1410) 


Está dividido en los siguientes capítulos: Climatología; población; estadística 
vital; estadísticas de salubridad; estadisticas de enseñanza primaria y secundaria; 
faltas de policía; estadísticas judiciales; producción agrícola; producción pecuaria; 
egresos e ingresos del Gobierno central y local; estadística bancaria y monetaria; 
comercio exterior; estadisticas de transporte 


Statistical Abstract of the United States, 1959. Prepared under the direction of 
Edwin D. Goldfield, Chief, Statistical Reports Division. 80th annual edition 
Washington, D.( U.S. Govt. Print. Off., 1959. Department of Commerce 


Bureau of the Census. 1042 p. $3.50 (U.S.). (USA-1410) 


Summary of statistics on the social, political, and economic organization of 
the United States 


Presents data for the most recent year or period available during the early 
part of 1959. Worthy of note this vear are those affecting the subjects of scientific 
research and development, personal health, housing values and financing and travel 


Cuba Resúmenes Estadísticos Seleccionados (Síntesis Cronológica). La Habana, Imp. 
P. Fernández $ Cía.. 1959. Ministerio de Hacienda. Dirección General de Esta 
dística. 143 p Cuba-1400) 
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Int 


Contenido: Area y población; comercio exterior; industria azucarera; industria 
tabacalera; producción, importación, exportación y consumo; finanzas; transporte 
y servicio; edificaciones y salarios; misceláneas 


Statistical Abstract of Latin America for 1957 3d. ed. Los Angeles, California, 


1959. Committee on Latin American Studies, University of California. 39 p 
(Int-1410) 


Contents: Area land use; population: social statistics; education; vital sta 
tistics, and housing; health, and social security; labor statistics; domestic product, 
forestry, fishing, and agriculture; agricultural production, and livestock; mineral 
production, and electric energy; industria! production; industrial consumption, and 
communications; transportation; foreign aid, investment, elections, and armed forces; 
public finance; financial statistics; trade of dependencies; trade of 


independent 
states 


CENSUS — CENSOS 


Bases para la Identificación de la Población Económicamente Activa y No Econó 
micamente Activa: Su Comprobación Experimental. Por la Secretaría del TASI 
Preparado por Roque García-Frías. Washington, D.( 
del Censo de América de 1960 (COTA-1960), TASI 
métodos y procedimientos Int-1ASI-2/10) 


wgosto 1959. Programa 


Esp.-estudios sobre 


Contenido: Introducción; proceso de captación de la información, reclasifica 
ción de la condición de actividad; identificación de la población económicamente 
activa y no económicamente activa atendiendo a uno y otro de los dos períodos 
de referencia; apéndice: a, Posible diseño de la sección pertinente de la 


boleta 
censal, con ejemplos ilustrativos; b, definiciones de las 


condiciones de actividad 
e inactividad prevista en la instrucciones a los empadronadores; c, puntos esenciales 


a considerar en las instrucciones; d, explicación de los ejemplos dados en la boleta 


“The Collection of Basic Demographic Data in Under-Developed Territories.” By 
C. J. Martin. Bulletin de 'Institut International de Statistique, tome XXXI 
3éme livraison, 1954. p 7-27. (Int-ISI-3020) 


al. 


Paper issued at the 28th Session of the International Statistical Institute 


“European Programme for National Housing Censuses.*” Conference of European 
Statisticians, Working Group on Censuses of Population and Housing, doc. WG.6/82 
April 24, 1959. 36 p. (approx.). (Int-UN-3020) 


Contents: Introduction; the enumeration units: Definitions and classifications; 
topics from which data are collected; definition and classification of each topic; 
tabulation programme; annex: Tabular presentation of the tabular programme 


“European Programme for National Population Censuses.'” Conference of European 
Statisticians, Working Group on Censuses of Population and 
WG.6/81, April 17, 1959. 63 p. (approx.). (Int-UN-3020) 


Housing, do« 


Contents: Introduction; topics for which data are to be collected: definition 


and classification of each topic: Location at time of census and/or usual place 


of residence, total population, size of locality, urban-rural classification, household 
and familv data, sex. age, marital status. place of birth, citizenship, economic 
characteristics, dependency statistics, language, ethnic or nationalitvy characteristics 
level of education, children-total live-born, secondary occupation, industry and 
status, literacy, school attendance; tabulation programme; annexes: Y, Correspondence 
table between the classifications bv occupation and status and the 


socio-economic 
classification; TI, svnoptic presentation of the tabulation programme 


“The 1960 World Census of Agriculture.” By P.V. Sukhatme. Bulletin de PInstitut 
International de Statistique, tome 36, 4e livraison, 1958 p. 239-250 Int-I15S1-3020) 


Contents: Introduction; what is an agricultural census?; scope of 1960 World 
Census of Agriculture (changes incorporated in the 1960 Program compared with 
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the 1950 Program): scope of tabulation; relation with other censuses; role of 
sampling methods; résumé, 


“The 1960 World Census of Agriculture from the Administrative Aspect.” By M. 
Rauterberg. Bulletin de PInstitut International de Statistique, tome 36, 4e livraison. 


1958, p. 228-238. (Int-1SI-3020) 


Contents Administrative measures under the aspect of current statistical work 
and modern statistical methods; law on census of agricultural holdings; provision 


of funds and of other resources; census date; organization of the census of 
agricultural holdings; résumé. 


“O Programa Mundial de Renceseamentos da Populacáio.” [Traduzido por María 
Helena G. Miglievich.] Revista Brasileira de Estatística, ano XIX, no. 75-76, julho- 
dezembro 1958 p 95-107. (Bras-3040) 


Praduzido do artigo original publicado na Revista Internacional del Trabajo, 
Janeiro 1958. 


Conteúdo: A cooperacáo internacional; os recenseamentos nacionais; alcance 


dos recenseamentos decenais; estatísticas fornecidas pelos recenseamentos e problemas 
do trabalho; estadísticas de máo-de-obra e dados conexos; recursos nacionais de 
máu-de-obra; utilizacio de máo-de-obra; classificacio segundo o ramo de atividade, 
atuacio no profissio e ocupacáo; condicóes de trabalho 


“Some Observations on the 1960 World Census of Agriculture.'' By P. C. Mahalano- 
bis. Bulletin de PInstitut International de Statistique, tome 36, 4e livraison, 1958, 
p. 214-221. (Int-1SI-3020) 


Contents: Basic data; sample surveys of agricultural holdings; combined sample 
survey of population and agriculture; international comparability; accuracy of 
agricultural statistics; résumé, 


Programa do Recenseamento Geral de 1960: Profundidade do Censo Demográfico. 
[Rio de Janeiro!, 1959. Instituto Brasileiro de Geografia e Estatística. Conselho 
Nacional de Estatística. Núcleo de Planejamento Censitário. 37 p. Documento 
no. 4 Bras-2100) 


Reúne os estudos realizados pelo NPS sóbre a profundidade do Censo Demo- 


gráfico de 1960, isto é, os tópicos (e seus conceitos) a serem por éles investigados. 


Divide-se em 3 partes: IT, Introducáo; HI, programa de Censo Demográfico de 


1960  (listagem dos tópicos cuja investigacáo é proposta); e III, apreciacáo do 


programa, em que se expóe a conceituacáo básica dos assuntos em discussáo. 


Recenseamento de 1960, Programa International: A, Censo de Populagáo. (Pronun- 
ciamentos da Repartigio Censitária Brasileira). Rio de Janeiro, 1958. Instituto 
Brasileiro de Geografia e Estatística. Conselho Nacional de Estatística. Núcleo de 
Planejamento Censitário. 153 p. Documentos censitários, série E, no. 2. (Bras-2100) 


Reúne-se neste documento censitário os elementos de consulta preparados pela 
Secretaria-Geral do TASI, desde 1955 (relatórios sóbre COTA-1950) até o projeto 
final levado á decisáo da VI Sessáo da COINS, juntamente com as respostas elabo- 
radas pela reparticáio censitária do País. 


Census Test, June 1959: Enumeration Manual. Ottawa, 1959. Dominion Bureau of 
Statistics. 111 p Can-2100) 


Contents: Part I, general instructions; part MH, enumeration forms: A, popula- 


tion and housing questionnmaires; B, agriculture questionnaires; part TI, 
administration 


Censo Agropecuario de 1955 San José, 1959. Ministerio de Economía y Hacienda. 
Dirección General de Estadística y Censos. 387 p. (CR-2210) 


Contiene los resultados finales 


Incluve en forma sumaria la metodología utilizada, y copias de las boletas 
censales 
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Guat 


Información General sobre el Censo Experimental de Población, Habitación » 
Agropecuario en el Municipio de “Santa Cruz Verapaz,” del Departamento de 
Alta Verapaz, República de Guatemala. Por la Secretaría del IASI. Washington, 
D.C., agosto 1959. 23 p. Programa del Censo de América de 1960 (COTA-1960) 
IASI doc. 3971 Esp. (Guat-2100) 


Contenido: Antecedentes; preparativos; el empadronamiento; primeras obser 
vaciones sobre el funcionamiento del censo experimental; muestra de mozos colonos 
Apéndices: 1, Area experimental (mapa); 2, boleta del Séptimo Censo de Población, 
1960; 3, boleta del Segundo Censo de Habitación, 1960; 4, boleta del Segundo Censo 
Agropecuario, 1960 


“El Lugar de un Censo Agrícola en un Sistema de Estadística Nacional 
Gilberto Lovo. Bulletin de Ulnstitut International de Statistique, 
livraison, 1958, p. 201-213. (Int-1SI-3020) 


Por 
tome 36, 4e 


Contenido: Estadística y programación; la experiencia mexicana en 1950: Re 
colección o levantamiento, cuestionarios, crítica, tabulación 


presentación. Resú 
menes en francés e inglés 


Paraguay: Primer Censo Industrial, 1955 Asunción, Fall. Gráf 
ricana-Moreno Hnos., 1958. Ministerio de Industria v Comercic 
del Primer Censo Industrial. 221 p. (Par-2250) 


de Casa Ame 
Comisión Nacional 


Contiene los resultados finales definitivos sobre Industrias manufactureras 
industria forestal v usinas de electricidad 


“Adapting Census Procedures to Meet Todav's Needs.” Proceedings of the Social 
Statistics Section, 1958, p. 1-15. (USA-9000) 

Contains three papers: “Teaming Up Censuses and Samples.” by Frederick 
F, Stephan; “Meeting Present Day Needs for Census Data in Agriculture,” bw 
Arnold J. King; “Procedures for the 1960 Census of Population and Housing.” 
by Morris H. Hansen. 


Census Tract Manual. 4th ed. Washington, D.( 1958. Department of Commerce. 
Bureau of the Census. 47 p. (USA-2/00) 


Contents: What census tracts are; what areas are eligible for census tracts; 


how to get census tracts established; appointment of census tract key person; 
making tract statistics useful; census tract revisions; tract-related areas; other 
selected statistical areas; appendix A, further uses of census tract data 


Two appendixes attached; C, List of Census Tract Key Persons; D, List of 
Census Bureau Regional Supervisors 


Localities and Urban-Rural Classification in 1960: Census Program of the United 
States of America. Washington, D.C., 1959, Department of Commerce. Bureau 
of the Census. 15 p. (approx.) Conf.Eur.Stats/WG.6/78. (USA-2100) 


Contents: Localities; urban-rural classification; classification of urban and 
rural for the 18th Decennial Censuses of Population and Housing 


“New Subjects and New Emphasis in the 1960 Housing Census.” By Wayne F 
Daugherty. Proceedings of the Social Statistics Section, 1958, p. 21-23. (USA-9000) 
Paper presented at the Annual Meeting of the American Statistical Association 


Chicago, 111., December 27-30, 1958, under the sponsorship of the Social Statistics 
Section. 


NonG “On Adjusting Sample Tabulations to Census Counts.'” Bv M. A. El-Badry and 


F. F. Stephan. Journal of the American Statistical Association. vol. 50, no. 27 
September 1955, p. 738-762. (USA-3040) 

Contents: Introduction; and example of the problem of adjustment; an 
example of two-way adjustment; application of statistical theory to the adjustment 
of sample estimates; Markoff estimates; estimation of population call frequencies; 
the method of proportional distribution of marginal adjustments: the method 
of array proportions Includes bibliograph 
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Chile 
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“Planning the 1960 Censuses to Meet National and Local Needs.” Proceedings 
of the Social Statistics Section, 1958, p 7-32. (USA-900M 


Contain three papers: “What will the 1960 Censuses Do?,”” by Conrad Taeubet 
“New Subjects and New Emphases in the 1960 Housing Censuses,'? by Wayne 1 
Dougherty; “What is New in Our Eighteenth Decennial Census of the Population?,' 
by Henry S. Shrvock. Includes a discussion: “Panel on Planning the 1960 Censuses 
to Meet National and Local Needs,” by J. T. Marshall 


STATISTICAL SCIENCF CIENCIA ESTADÍSTICA 


Alcance y Métodos Principales de la Elaboración de Datos. Preparado conjunta 
mente por la Oficina de Estadística de las Naciones Unidas y la Sección Estadística 
de la Organización de las Naciones Unidas para la Agricultura y la Alimentación 
Praducido por el Departamento de Estadística de la Unión Panamericana. (Edición 
provisional.) Washington, D.( julio 1958. 29 p. Estudios sobre métodos de ela 
boración de datos, no. 1. TIASI doc. 2941 SP.  (Int-UN-31/10) 


Publicado también en inglés con el título de Scope and Principal Methods of 
Data Processing 


Contenido: Introducción; naturaleza y alcance de la elaboración de datos; 
aspectos funcionales de la elaboración de datos: métodos manuales y mecánicos de 
elaboración; máquinas a base de tarjetas perforadas; factores que determinan el 
uso o no de los métodos de tarjetas perforadas; equipo electrónico para la clibora 
ción de datos 


del Instituto Interamericano de Estadística y por el Departamento de Estadística 
de la Unión Panamericana Durante el Período 1954-59. Washington, D.C., 


1959. Instituto Interamericano de Estadística 16 p. TASI doc 3042 
(Int-TASI-3030) 


Informe sobre las Principales Actividades Desarrolladas por la Secretaría General 


julio 
Esp 


Métodos Manuales e Instrumentos tara la Flaboración de Datos. Preparado con 
juntamente por la Oficina de Estadística de las Naciones Unidas yv la Sección 
Estadística de la Organización de las Naciones Unidas para la Agricultura y la 
Alimentación. Traducido por el Departamento de Estadística de la Unión Pana 
mericana. (Ed. prov.) Washington, D.C., julio 1958. 50 p. Estudios sobre métodos 
de elaboración de datos, no. 4. TASI doc. 2939 Sp. (Int-UN-3/10) 

Publicado también en inglés con el titulo de Manual Methods and Tools for 
Data Processing 


Contenido: Introducción; factores que determinan los métodos e instrumentos 


de elaboración; recepción de boletas e indicaciones sobre los documentos para 
clasificación; crítica; extracción de información; métodos de separación; sistema de 
separación manual de tarjetas perforadas; instrumentos auxiliares para cálculos; 
consolidación de cuadros; controles de producción y de exactitud, y evaluación 


Separación de Tarjetas Perforadas. Preparado conjuntamente por la Oficina de 
Estadística de las Naciones Unidas y la Sección Estadística de la Organización de 
las Naciones Unidas para la Agricultura y la Alimentación. Traducido por el 
Departamento de Estadística de la Unión Panamericana Ed. prov.) Washington 
D.C., julio 1958. 27 p. Estudios sobre métedos de elaboración de datos, no. 9 
IASI doc. 2940 Sp. (Int-UN-31170) 


Publicado también en inglés con el título de Punch Card Sortimg 


Contenido: Introducción; máquinas separadoras; métodos de separación em 
pleados comúnmente con las máquinas estándares: estimación del tiempo necesario 
para la separación: algunos controles en la separación 


Chile. Un compendio de los servicios v actividades estadísticos. 2a. ed. Wash 
ington, D.( 1959. Instituto Interamericano de Estadística. 90 p. Actividades 
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estadísticas de las naciones americanas, no. 8. TASI doc. 3959 Esp. $0.25 
Chile-3000) 


Contenido: Legislación fundamental y organización del sistema estadístico 
nacional; censos; estadísticas continuas; participación en actividades internaciona 
les; educación estadística; esquema de organización de la Dirección General de 
Estadística y Censos. Incluye 3 apéndices: 1, Legislación estadística de Chile; 2 


rincipales organismos de Chile, oficiales y semioficiales encargados de recoger 
5 P 


o publicar datos estadísticos; 3, principales publicaciones periódicas de Chile que 


contienen datos estadísticos. Incluve también: Summary of the Statistical Activities 
of Chile 


Guat “Las Actividades Estadísticas de Guatemala lrabajo preparado en octubre 


de 1958 por René Arturo Orellana G. y Jorge Arias B. boletín Estadístico, no. 7-8 


/ 
» 


julio-agosto 1958, p 11-61 Guat-1420) 


Incluye legislación fundamental y organización del servicio estadístico nacional 
actividades censales, estadisticas continuas, participación en actividades internacio 
nales, principales organismos particulares, educación estadistica; apéndices 


Guat Guatemala Un compendio de los servicios y actividades estadísticos %a. ed 
Washington, D ( 1959. Instituto Interamericano de Estadística. 60 p. Actividades 
estadísticas de las naciones americanas, no. 12, JAS! doc 3919 Esp (Guat-3030) 


Contenido: Legislación fundamental y organización del sistema estadístico 
nacional; censos; estadísticas continuas; participación en actividades internacionales; 
principales organismos particulares con servicios estadisticos; educación estadística; 
esquema de organización y funciones de ia Dirección General de Estadística; sum 
mary of the statistical activities of Guatemala. incluye tres apéndices: 1, Legislación 
estadística de Guatemala; 1, principales organismos de «Guatemala, oficiales y 
semioficiales, encargados de recoger o publicar datos estadísticos; HI, principales 
publicaciones periódicas de Guatemala que contienen datos estadísticos 


“Historia de la Estadistica Nacional Por Rodolfo Flores Talavera doletín de 
la Sociedad Mexicana de Geografía y Estadística, tomo LXXXVI, no. 1-3, julio 
-diciembre 1958. p. 13-45 Méx-3040) 


Publicado también en Memoria de la Cuarta Reunión Nacional de Estadística 


Está dividida en tres partes: La estadística durante el período prehispánico; la 
estadística durante la colonia; la estadística del México independiente 


Handbook on Industrial C.assification Prepared by John T. Murray. Wash 
ington, 1D).( U.S.Govt.Print.Off.|, 1058. Department of Labor Bureau of 


Employment Security. 189 p APpTOx Employment security research methods 
BES No. R9YI USA-3221)) 


This edition is keved for use with the 1957 edition of the Standard Industria 
Classification Manual issued by the U.S. Bureau of the Budget 


Contents: Industrial classification in the employment security program; 
development of the industrial classification svstem; the Standard Industrial Clas 
sification Manual, 1957; applying industry codes; selected coding concepts and 
problems Cases; exercises 1ppendix: Conversion iables 


NonG Charting Statistics. By Mary Eleanor Spear. New York. McGraw-Hill Book Co 
1952. 253 p 553.00 U.S.) NonG-3261)) 


Develops all types of charts from the simple poster chart to the 3-dimensional 
exhibit, shows how to break down and group data, how to instruct a draftsman, 
and it supplies pointers on chart evaluation for recognizing effective results 


10 chapters cover: Graphic presentation; planning the chart; line charts; the 
surface chart; column charts; the bar chart; the map chart; other trpes and their 
use; exhibits; duplicating. color, television 


NonG Fractional Factonial Experiment Designs for Factors at Three Levels. By W.S 
Connor and Marvin Zelen. Washington, D.C., U.S.Govt.Print.Off., 1959, Depart 
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ment of Commerce. National Burcau of Standards. 37 p. Applied mathematics 
series, no. 54. (NonG-3140) 

Contents: Description of experiment plans; loss of information; analysis of 
fractional plans; bibliography; fractional factorial designs 


NonG Further Contributions to the Solution of Simultaneous Linear Equations and 
the Determination of Eigenvalues. By E. L. Stiefel, P. Henrici, and H. Rutishauser. 
Washington, D.C., U.S.Govt.Print.Off., 1958. Department of Commerce. National 
Bureau of Standards. 8l p. Applied mathematics series, no. 49. (NonG-3/40) 


Contains three papers which describe some recently developed techniques for 
the solution of certain problems of numericai analysis: Kernel Polynomials in 
Linear Algebra and Their Numerical Applications, by E. L. Stiefel; the Ouotient- 
-Difference Algorithm, by P. Henrici; Sotution of Figenvalue Problems, with the 
IR-transformation, by H. Rutishauser. 


NonG “How Many of a Group of Random Xumbers Will be Usable in Selecting a 
Particular Sample?” By Howard L. Jones. Journal of the American Statistical 
Association, vol. 54, no. 285, March 1959, p. 102-122. (USA-3040) 


This paper was presented August 28, 1958 at the annual meeting of the 
Institute ol Mathematical Statistics under the title “The Number of Occupied Cells 
of a Particular Subclass (When Objects Are Assigned to Cells at Ranaom).”” 


NonG A Manual on Sampling: Elements of sample Survey Theory and Practice. 
[New York], 1959. Statistical Office of the United Nations. 216 p. (NonG-3150) 


his manual is intended for statistical offices which will be assumed not to 
dispose of the services of a sampling expert. In part I theoretical concepts and 
processes are described, discussed and compared in what purports to be simple 
terms, with emphasis on common sense rather than the mathematical aspects of 
the subject, though usually the formulae of estimation are given; part II consists 
for the most part of a set of examples illustrating a wide variety of processes, 
prefaced by the formulae used for estimating the mean (or aggregate), the relevant 
sampling error variance, and indicating in some detail the working of the data. 
These data consist of a body of actual agricultural statistics which were available 
for an area in an European country, which statistics march, like a stage army, 
through all the processes. In a word, the second part is mainiy intended to show 
how to make the calculations 


len. London, Macmillan and Co., Ltd. 


£ 
31 


NonG Mathematical Economics, By R.G.D. A 
1956. 768 p. 63 s. (Gr.Brit.). (NonG-3 


| 
3 ) 

Chapter 1 and 3 deal with a rather elementary account of dynamic models, 
followed by chapter 4, 5, and 6 on the mathematics of complex numbers and 
differential and difference equations; chapter 7 and 8 deal with some trade cycle 
theories in detail, and chapter 9 with the application of the engineers' closed -loop 
control systems to macro-economic stability problems. Chapters 10 and 11 deal 
about “general economic equilibrium'”” and elementary features of imput-output 
analysis, respectively; both subjects stress the need for matric algebra, which is 
developed and applied in chapters 12-14; chapters 15 and 16 deal with elementary 
game theory and linear programming; chapters 17-19 with the theories of the 
firm and of the consumer; chapter 20 with aggregation problems. Includes an 
appendix on the algebra of operators 


NonG Modern Business Statistics. By John E. Freund and Frank J. Williams. 
Englewood Cliffs, New Jersey, Prentice-Ha!l, Inc., 1958. 539 p. $7.50 (U.S.). 
(NonG-3330) 


NonG “On the Problem of Matching Lists by Samples.'* By W. Edwards Deming and 
Gerald J. Glasser. Journal of the American Statistical Association, vol. 54, no. 286, 
June 1959, p. 403-415. (USA-3040) 


Presents theory for estimation of the proportions of names common to two ot 
more lists of names, through use of samples drawn from the lists. The theory 
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covers a) the probability distributions, expected values, variances, and the third 
and fourth moments of the estimates of the proportions duplicated; b) testing a 
hypothesis with respect to a proportion; c) optimum allocation of the samples; 
d) the effect of duplicates within a list; e) possible gainms from stratification. 
Includes examples illustrating some of the theory. 


NonG “Problems in the Probability Theory of Storage Systems.' By J. Gani. Journal 
of the Royal Statistical Society, vol. XIX, no. 2, 1957, p. 182-206. (GrBr-3040) 


Published also as reprint 

Contents: Provisioning: The problem of emptiness; provisioning: Optimal 
inventory policy; finite dams: Stationary distributions; infinite dams: Stationars 
distributions; numerical methods; references. 


NonG Quality Control and Applied Statistics Yearbooks. By Robert S.Titchen and 
others (editors). 1956 New York. Interscience Publishers. (NonG-3160) 


Each volume is a collection of reviews of papers published during the vear 
given as the volume index. The original papers are from more than 300 journals 
published throughout the world. 


NonG Sampling in Sweden: Contributions to the Methods and Theories of Sample 
Survey Practice. By Tore Dalenius. Stockholm, Almqyvist $* Wiksell, 1957. 247 p. 
(NonG-3150) 


Contents: Synopsis of sample survey methods and theories; Swedish sample 
survey practice past and present; the use of the sample survey method in the 
acreage and livestock inventory of 1950; the survey research center of the Central 
Bureau of Statistics; possibilities of improving Swedish sample survey practice; two 
contributions to the treatment of the frame problem in Swedish sample survey 
practice; the problem of optimum stratification; determining the optimum member 
of strata; multiparametric stratified sampling; the problem of regional statistics: 
contributions to the treatment of the non-response problem; prospects of Swedish 
sample survev practice. 


NonG “Sobre la Teoría de Muestreo de Poblaciones Finitas.' Por Morris H. Hansen 
y William N. Hurwitz. Estadística, vol. XVI, no. 59-60, junio-septiembre 1958, 
p. 204-239,  (Int-IASI-3040) 


Praducción del Artículo “On the Theory of Sampling from Finite Populations,” 
publicado in The Annals of Mathematical Statistics, vol. XIV, no. 4, December 1943. 


NonG Vocabulario Estadístico Plurilingúe. Madrid, Artes Gráf., 1959. Instituto Na 
cional de Estadística. 189 p. (NonG-3005) 


Contenido: 1 parte: Versiones directas del alemán, esperanto, francés, húnga: 
inglés, italiano, portugués y ruso al español; II parte: Versiones indirectas; 11 
parte: Idiomas nórdicos: Danés, finlandés, noruego y sueco al español. 


DEMOGRAPHY — DEMOGRAFIA 


Demographic Yearbook, 1958. — Annuaire Demographique, 1958. Special topic 
Marriage and divorce statistics. Tenth issue. New York, 1958. Department of 
Economic and Social Affairs. Statistical Office. 544 p. Sales mo. 58.XHI.1; 
$6.50 (U.S.). (Int-UN-5000) 


The basic tables of the Yearbook remain unchanged. They include the usual 
revised and extended statistics of area, the latest census of population, population 
increase and density for each of 277 geographic units of the world, together with 
aggregates for the continents and regions; a 20 year trend of total population for 
over 200 areas; population distributed by age and sex; trends of natality, general 
mortality, infant mortality and foetal mortality, as well as current distributions 
of births by age of mother, deaths by age and sex, mortality by cause and 
expectation-of-life values at selected ages. 
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Includes new features: 1, a table showing the birth, death, marriage, divorce, 
infant mortality, neo-natal-infant-mortality, post-neo-natal-infant-mortality, mater- 
nal-mortality and natural-increase rates for 116 areas having relatively reliable 
statistics; 2, estimated aggregate birth and death rates for the world and its regions; 
and 3, a new coe, which has been devised to aid in evaluating the accuracy of 
the current estimates of population throughout the world. 


Economic Characteristics of International Migrants: Statistics for Selected Countries, 
1918-1954. — Migrations Internationales selon les Caractéristiques Economiques: 
Statistiques pour Certains Pays, 1918-1954. New York, [1958]. United Nations. 
Department of Economic and Social Affairs. 314 p. Population studies, no. 12. 
Sales No.: 58.XI11.3; $3.50 (U.S.). (Int-UN-5300) 

Contains data for thirty-six selected countries or territories. The selection 
of the countries represented takes into account the interest attaching at present 
io European emigration, in particular towards areas of low population density 
which are economically under-developed. The majority of the statistical tables 
published here give the number of emigrants and immigrants classified by occupa- 
tion or by branch of economic activity (industry). In addition, some statistics 
relate to migrants classified by dependency on economic activity, by status as 
employer, employee, etc., and by various economic characteristics such as amount 
of cash declared, amount of expenditures for assisted passage schemes, and 
remittances of emigrants to their home country. 


La Estructura Demográfica de las Naciones Americanas: Análisis Estadístico-Censal 
de los Resultados Obtenidos bajo el Programa del Censo de las Américas de 1950 
(COTA-1950): Volumen II, Características Económicas de la Población. Washington, 
D.C., 1959. Instituto Interamericano de Estadística. 2 vol.: Tomo 1, Población 
Económicamente Activa y No Económicamente Activa. Características Generales 
de la Población Económicamente Activa; tomo 2, Características Combinadas de la 
Población Económicamente Activa. 1ASI doc. 3920 Esp. (Int-1ASI-5110) 


Forma parte del conjunto de publicaciones sobre el Censo de las Américas 
de 1950 descritas en la introducción del volumen del conjunto titulado Relato del 
Censo de las Américas de 1950 (1ASI doc. 2032b). 


(Vol. I aparecerá próximamente.) 


“Great Cities and Their Surroundings: A Statistical Delimitation Problem.” By 
Ivar Oman. Bulletin de l'Institut International de Statistique, tome 36, 4e livraison, 
1958, p. 27-41. (Int-1SI-3020) 

Contents: The need for statistics on urban agglomerations; the concept of 


the great city in the past; the characteristics of the urban agglomeration and 
associated problems; experiences from greater Stockholm; summarized views; résumé. 


“A Populacáo Ativa no Mundo.” Distribuicáo por profissiío e segundo a situacáo 
na profissio. Revista Brasileira de Estatística, ano XIX, no. 73-74, janeiro-junho 
1958, p. 17-33. (Bras-3040) 

Publicado na Revue Internationale du Travail, no. 2, vol. LXXIV, agósto 1956, 
e de autoria de uma equipe técnica do Escritório Internacional do Trabalho, o 
presente artigo é o terceiro de uma série consagrada ao estudo da composicáo ativa 
no mundo. 


Seminar on Population Studies in Southern European Countries, Athens, 15-26 
September 1958. Organized by the United Nations Bureau of Social Affairs and 
Technical Assistance Administration in co-operation with the Government of 
Greece. New York 1959. United Nations. 32 p. ST/TAA/SER.C/36; ST/SOA/38. 
(Int-UN -5000) 


Contents: Summary of principal findings; summaries of results of discussions 
on the main topics of the seminar: Public Health, maternity and child welfare 
services; education and other services for youth, urbanization, services for the 
aged, other social problems, industrialization and other economic problems; housing 
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and population policies; suggestions for future activities. Annexes: 
of meetings; B, list of participants and observers; C, 
the seminar. 


A, programme 
list of papers presented to 


The World's Metropolitan Areas. By International Urban Research, Institute of 
International Studies, University of California (Berkeley) under the direction of 
Kingsley Davis. Berkeley and Los Angeles, California, University of California 
Press, 115 p. $3.00 (U.S.). (Int-5110) 


Contents: Urban science and comparative analysis; urban aggregates and their 
delimitation for international comparison; guide to the table and appendix; the 
population of metropolitan areas. Includes appendix: Component units of each 
metropolitan area, with sources of data. 


“O Crescimento da Populacáo do Distrito Federal e a Sua Distribuicáo segundo 
Circunscricóes.'”” By Alceu Vicente W. de Carvalho. Estudos Demográficos, no. 249, 
marco 9, 1959, 5 p. (Bras-5110) 

Conteúdo: Desenvolvimento da populacáo de 1890) a 1950; distribuicáo da 


populacáo por circunscricóes; previsio do crescimento da populacáo nos anos de 
95 960. 
1950 a 1960 


Bras From Community to Metropolis: A Biography of Sáo Paulo, Brazil. Gainesville, 
Fla., University of Florida Press, 1958. 341 p. $7.50 (U.S.). (Bras-5110) 


Contains four parts: 1, Colonialism and new settlements; 1I, formation of the 
city mind; III, city growth; IV, the modern age. Through them is traced the 
development of the city from its founding in 1554 as an inland outpost of the 
coastal settlement of Sáo Vicente to its present position. Includes bibliography. 


“A Imigracáo Internacional para o Brasil no Após-Guerra (1945-1957).” Por Sylvia 
de Castro Aragáo. Estudos Demográficos, no. 248, fevereiro 25, 1958, 23 p. 
(Bras-5110) 


Conteúdo: Marcha da imigracáo internacional para o Brasil no período de 
1945 a 1957; discriminacáio dos imigrantes segundo o sexo; discriminacáío dos 
imigrantes segundo a idade; discriminacáo dos imigrantes segundo a profissio; a 
alfabetizacáo dos imigrantes; nacionalidades de imigracáo mais intensa no período; 
migracáo espontánea e imigracáo dirigida. 


Vital Statistics, 1957. — Statistique de l'État Civil, 1957. [37th annual report.] 
Ottawa, Edmond Cloutier, 1959. Dominion Bureau of Statistics, Health and 
Welfare Division. Vital Statistics Section. 212 p. (Can-5200) 


This report follows the pattern of its predecessor in that it contains a brief 
introductory analysis, whose function is to highlight the main features of the 
1957 data in relation to past trends. The tabular section presents statistics on 
births, deaths, infant deaths, neo-natal deaths, maternal deaths, marriages, and 
dissolutions of marriages. 


“El Crecimiento de la Ciudad de México: Causas y Efectos Económicos.' Por 
Edmundo Flores. Investigación Económica, vol. XIX, no. 74, segundo trimestre 
de 1959, p. 247-281. (Méx-6000) 

Primera parte del cap. V del Tratado de Economía Agrícola. (Otros capítulos 
publicados en otros números de esta revista.) 


Contenido: Las versiones románticas; el proceso de crecimiento urbano; me- 


didas destinadas a impedir la sobreurbanización; el crecimiento metropolitano en 
México: Sus aspectos salientes; causas y efectos del crecimiento metropolitano; la 
atracción de la metrópoli; los factores de repulsión. 


Los Factores Demográficos en la Planeación Económica. Por Daniel Moreno. 
México, [Tall. de Manuel Casas], 1958. Cámara Nacional de la Industria de la 
Transformación. Comisión de Planeación Económica. 329 p. (Méx-5000) 


Contenido: Población de México en diversas épocas; la población rural; la 


población urbana; dinámica de la población; la población indígena; características 
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fundamentales; alfabetismo, tecnología y cultura superior; la fuerza de trabajo; 
población económicamente inactiva; el factor demográfico y las comunicaciones; 
premisas demográficas de una planeación económica. Incluye bibliografía. 


Trends in Birth Rates in the United States since 1870. By Bernard Okun. 
Baltimore, Md., Johns Hopkins Press, 1958. 203 p. The Johns Hopkins University 
studies in historial and political science. (USA-5211) 

Brings together new empirical evidence of the secular decline in fertility in 
the United States and contains useful breakdowns by race, state, region, residence 
(rural, urban, rural-farm, and rural-nonfarm), and nativity for whites. 


PR People, Jobs and Economic Development. A case history of Puerto Rico 
supplemented by recent Mexican experiences. By A.]J. Jaffe, Glencoe, IMlinois, The 
Free Press, [1959]. Bureau of the Applied Social Research of Columbia University. 
381 p. $6.00 (U.S.). (USA PR-5100) 


Contents: The general argument. Part 1: Puerto Rico's experiences: The 
setting for economic development; economic change in historical perspective; trends 
in population growth; employment and unemployment; industrial and occupational 
changes; wages and labor utilization; school attendance. Part 1I: Implications for 
other underdeveloped areas: Changes in employment levels, a model; the birth 
rates and economic growth; education and economic development; the role of 
government; the model applied: Mexico. Includes five appendixes: The Puerto 
Rican labor force survey, definitions and explanations; further details on the 
activities of the Puerto Rico Economic Development Administration; the concept 
and measurement of under-employment; suggestions for a supplemental grouping 
of the occupational classification system; differential growth of regions. 


Includes bibliography. 


NonG Malthusianism and Conservation: Their Role As Origins of the Doctrine of 
Increasing Economic Scarcity of Natural Resources. By Harold J. Barnett. 
Washington, D.( 1959. Resources for the Future, Inc. 32 p. REF reprint no. 12. 
NonG-5110) 


Paper presented at the Universities-National Bureau of Economic Research 
Conference, December 5-7, 1958. 


Contents: Social importance; contemporary economist and  demographer 
writings; Malthus; the first conservation movement; two concluding observations. 


ECONOMICS — ECONOMÍA 


The Customs Areas of the World. New York, 1959. Statistical Office of the United 
Nations. 28 p. Statistical papers, series M, no. 30. SI STAT/SER.M 30. Sales no.: 
59 .XVIH.5; $0.40 Y.5S.? (Int-UN-6900) 


Contains descriptions based largely on official information supplied by Govern 
ments. The date refers to the middle of 1959. 


Glossary of Inter-American Maritime Terminology:  English-Spanish-Portuguese- 
-French. Prepared bv Eugene Ysita. Washington, D.C., 1959. Pan American Union. 
128 p. ES-CTPP-Doc.5 (English). (Int PAU-6615) 


Contains over 1,900 maritime terms in English and their respective equivalents 
in Spanish, Portuguese and French. The terminology in English, which in this 
case is the basic language, is arranged under a strictly alphabetical order with 
the corresponding equivalents in the other three languages. A similar arrangement 
has been made for Spanish, Portuguese and French when each of these languages 
is used basically 


Additional terminology, obtainable by further research, will be periodically 
published in future supplements. > 


Informe sobre los Aspectos Agrícolas, Técnicos y Económicos de la Producción de 
Algodón en Centroamérica. Informe preparado por los señores F. Stewart Parsons, 
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Int 


en algodón de la FAO experto, y Angelo A. De Tuddo, economista, adscritos al 
Programa de Integración Económica Centroamericana. [Roma], 1958. Organización 
de las Naciones Unidas para la Agricultura y la Alimentación. 255 p. 
FAO/CAIS/58/1. (Int-FAO-6210) 


Contenido: 1 parte: Consideraciones de los problemas agrícolas y técnicos de 
la producción, manejo y beneficio del algodón en Centroamérica; 11 parte: Aspectos 
Económicos de la producción y comercialización del algodón en Centroamérica. 


Manual de Proyectos de Desarrollo Económico. Estudio preparado por el Pro- 
grama CEPAL/AAT de capacitación en materia de desarrollo económico. México, 
D.F., 1958. Naciones Unidas. 264 p. E/CN.I2/426 y  Add/1/Rev.l.; 
FAA/LAT/12/Rev.1. No. de venta: 58.11.G.5; $3.00 (U.S.A.). (Int-UN-6000) 


Publicado también en inglés con el título de Manual on Economic Development 
Projects. 


Consta de 2 partes: 1 Contenido del proyecto; Problemas y conceptos generales; 
estudio del mercado; ingeniería del proyecto; tamaño y localización de los proyectos; 
las inversiones en el proyecto, el presupuesto del ingreso y gastos y la ordenación 
de los datos básicos para la evaluación; financiamiento y organización; resumen 
y presentación del proyecto. TI, La evaluación de proyectos; equivalencias financieras, 
asignación de valores y efectos indirectos; criterios relativos a la productividad 


de un solo recurso; criterios relativos a la productividad del complejo de insumos 
y criterios mixtos. 


El Desarrollo Económico de la Argentina: Parte 1, Los Problemas y Perspectivas 
del Crecimiento Económico. Estudio realizado por la Secretaría de la Comisión 
Económica para América Latina. México, D.F., 1959. Naciones Unidas. Departa- 
mento de Asuntos Económicos y Sociales. 129 p. Análisis y proyecciones del de- 
sarrollo económico, V. E/CN.12/429/Rev !. No. de venta: 59.11.G.3. vol. 1; 
$1.50 (U.S.A.). (Arg-6000) 


Contenido: 1, La crisis estructural de la economía argentina y la orientación 


de sus soluciones; II, el estrangulamiento de la economía argentina y los factores 
que lo han provocado; III, las proyecciones del crecimiento económico argentino 
hasta 1967; IV, las inversiones de capital, los recursos para financiarlas y la balanza 
de pagos; V, los gastos e ingresos del Estado en el crecimiento del producto global 
de la economía; anexo: 1, La utilización del modelo de insumo-producto en las 
proyecciones de la economía argentina; II, cuadros estadísticos complementarios. 


29.1 Memoria Anual del Banco Central de Bolivia Correspondiente a la Gestión 


del Año 1957 Presentada al Señor Ministro de Hacienda y Estadística. La Paz, 
Edit. Fénix, 1958. 155 p. (Bol-6720) 


Contiene dos partes: La 1 trata de las principales tendencias de la economía 
nacional; y la II del movimiento bancario, y la balanza de pagos de Bolivia. 


Incluye cuadros estadísticos y balances. Anexo: Principales disposiciones legales 
de carácter económico. 


Contribuigáo ao Estudo dos Custos dos Transportes Ferroviário e Rodoviário. 
Por Arthur Neves Batista. [Rio de Janeiro, 19587] Rede Ferroviária Federal, S.A. 
Departamento Comercial. Setor de Estatística. 65 p. (aprox.). (Bras-6614) 


Conteúdo: Conceituacóes; custo do transporte ferroviário; custo do transporte 


rodoviário; conclusáo; apéndice: Cálculo dos custos médios dos transportes 
ferroviários. 


Statistical Summary: Financial Supplement, 1958. [Ottawa, 19597] Bank of Canada. 
150. (Can-6720) 


Statistical tables show the following breakdowns: Banking and monetary; 
Government of Canada direct and guaranted securities; securities and interest rates; 
foreign exchange; other financial statistics; public finance; population; selected 
trade and business statistics. 
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Chile “Los Recursos Hidráulicos de Chile y Su Aprovechamiento.' UN, E/CN.12/501/ 
Add.1, marzo 15, 1959, 273 p. (Int-UN-1000) 
Contenido: Descripción de Chile con especial referencia a su desarrollo hi- 
dráulico; metereología e hidrología; aprovechamiento de los recursos hidráulicos. 


XXXIV Informe Anual del Gerente a la Junta Directiva: lo. de Julio de 1956 — 
30 de Junio de 1957. Bogotá, D.E., 1957? Banco de la República. 2 vol.: Primera 
y segunda parte. (Col-6720) 


Contenido: 1 parte: Administración del Banco; II parte: Aspectos de la Econo- 
mía Colombiana, cuadros estadísticos: Cambio exterior, circulación monetaria, crédito 
del banco emisor, situación bancaria, comercio exterior, algunas consideraciones 
sobre la situación general del país. 


ElSal Estabilidad Monetaria y Desarrollo Económico de El Salvador. Sam Salvador, 
1959. Banco General de Reserva de El Salvador. Departamento de Estudios Econó- 
micos y de Estadísticas. 43 p. (ElSal-6720) 


Contenido: ¿Qué es estabilidad monetaria?; por qué la estabilidad monetaria 
es esencial para el desarrollo económico; aspectos financieros de nuestro desarrollo 
económico; problemas actuales y perspectivas. 


El Desarrollo Económico de Panamá. Estudio realizado por un Grupo de Trabajo 
Nacional, designado por el Gobierno de Panamá, y por la Secretaría de la Comisión 
Económica para América Latina. Panamá, 1959. Comisión Económica para América 
Latina. 665 p. Análisis y proyecciones del desarrollo económico, VIH. UN doc. 
E/CN.12/494. (Pan-6000) 

Contenido: 1, La evolución de la economía panameña en el período 1945-56; 
II, las proyecciones globales de la economía panameña para 1956; III, proyecciones 
de la capacidad para importar; IV, las proyecciones por sectores. Apéndices: A, 
Definición de los conceptos usados; B, Fuentes y métodos de las series estadísticas 
macroeconómicas. 


El Desarrollo Industrial del Perú. Preparado por la Secretaría de la Comisión 
Económica para América Latina. México, D.F., 1959. Naciones Unidas. Departa- 
mento de Asuntos Económicos y Sociales. 335 p. Análisis y proyecciones del de- 
sarrollo económico, VI. E/CN.12/493. No. de venta: 59.11.G.2; $4.00 (U.S.A.). 
(Perú-6400) 


Contenido: 1 parte, la industria peruana en relación con el conjunto de la 
economía nacional; 11 parte, características y problemas actuales de la industria; 
IM parte, las perspectivas del desarrollo industrial. Incluye anexos: 1, Fuentes y 
métodos de los cálculos sobre el producto bruto y otras magnitudes macroeconó- 


micas; TI, las estimaciones del quantum de la producción industrial para el período 
1945-55. 


RepDom Memoria Anual, 1957. Ciudad Trujillo, Edit. Montalvo, 1958. Banco Central 
de la República Dominicana. 70 p. (aprox.). (RepDom-6720) 


Contenido: La actividad económica en 1957; producto o gasto nacional bruto 
de la República Dominicana, 1956-57; intercambio comercial y balanza de pagos; 
medios de pago y situación monetaria; actividades de la Junta Monetaria y actua- 
ciones del Banco Central; legislación relativa a los bancos, correspondiente al año 
1957; balances, otros anexos. 


Agricultural Statistics, 1958. Washington, D.C., U.S.Govt.Print.Off., 1959. 
Department of Agriculture. 619 p. (USA-6200) 
Brings together the more important series of statistics concerning agriculture 


and closely related subjects. 


Highway Statistics, 1957. 13th ed. Washington, D.C., U.S. Govt.Print.Off., 1959. 
Department of Commerce. Bureau of Public Roads. 200 p. $1.25 (U.S.). 
(USA-6612) 
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Presents the 1957 statistical and analytical tables of general interest on motor 
fuel, motor vehicles, highway-user taxation, State and local highways finance, 
highways mileage, and Federal aid for highways. 

U.S. Income and Output. A supplement to the Survey of Current Business. 
[1958 ed.] Washington, D.C., U.S.Govt.Print.Off., 1958. Department of Com- 
merce. Office of Business Economics. 241 p. (USA-6100) 

Brings up to date the material contained in the 1954 edition of National Income, 
and includes new series and formulations. The range of subject matter has been 
broadened to include work in the field of income distribution. 


Contents: The economy viewed through the national income accounts; 
development of national income measures; data sources and procedures; statistical 
section (tables). 


NonG An Introduction to National Income Analysis. By Barry N. Siegel. Salt Lake 
City, Utah, University of Utah, 1958. 144 p.  (NonG-6100) 

NonG Desarrollo Económico: Principios y Normas. Por Harold F. Williamson y John 
A. Buttrick. Traducido por Federico G. Coleman. Rosario, Argentina, [Tall.Gráf. 
Emilio Fenner], 1958. Comisión de Educación Estadística del Instituto Interameri- 
cano de Estadística. 581 p. Biblioteca Interamericana de Estadística Teórica y 
Aplicada (sección B).  (NonG-6000) 

Publicado originalmente en inglés con el título de Economic Development: 
Principles and Patterns. 


Contiene varios estudios por diferentes autores. Dichos estudios están agrupados 
en dos partes: 1, Algunos factores del desarrollo económico; y II, algunos casos 
concretos en el estudio del desarrollo económico (Japón y Corea, India, México). 
Incluye bibliografía seleccionada. 

NonG Statistics as Applied to Economics and Business. By Robert H. Wessel, and 
Edward R. Willett. New York, Holt, [1959. 321 p. (NonG-6090) 


HEALTH AND CULTURAL STATISTICS — 
ESTADÍSTICAS DE SALUBRIDAD Y CULTURA 


Boletín Trimestral. 1959-. La Habana. Centro Regional de la UNESCO en el 
Hemisferio Occidental. (Int-UNESCO-7200) 


Incluye estudios monográficos y estadísticas educacionales sobre los países 
latinoamericanos. 


“Estadísticas para la Extensión de la Educación Primaria.” Boletín Trimestral, 
vol. 1, no. 2, abril-junio 1959, p. 20-35. (Int-UNESCO-7200) 

Contenido: Población escolar; fuentes de los datos demográficos; proyecciones 
de población en edad escolar. Incluye un cuadro sobre información complementaria 
sobre aspectos de la escolaridad obligatoria en América Latina, y bibliografía. 


Statistics on Libraires. [Paris, 1959.] United Nations, Educational, Scientific and 
Cultural Organization. 128 p. $1.70 (U.S.); ST/S/3.A (Int-UNESCO-7200) 

Contents: Chapter 1, National statistics: A, Independent countries; B, non-self- 
governing and trust territories; chapter 1I, international statistics on libraries. 
Includes bibliographical references. 


A brief historical outline of this undertaking was given in the introduction 
to the report International Statistical on Libraries and Book Production. 

See also Basic Facts and Figures, 1958. 
Summary of Four-Year Reports on Health Conditions in the Americas. Prepared 
for the XV bPanamerican Sanitary Conference. Washington, D.C., 1958. Pan 
American Sanitary Bureau. 123 p. Scientific publication, no. 40. (Int-PASB-7110) 

Contents: General vital statistics; maternal and child health; communicable 


diseases; sanitation programs; medical and health personnel; health services; hospital 
facilities. Includes appendix: Tables. 
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World Survey of Education: II, Primary Education. Paris, United Nations Edu- 
cational, Scientific and Cultural Organization, 1958. 1387 p. $26.00 (U.S.). 
(Int-UNESCO-7200) 

Contents: Chapter 1: World survey of education 1950-54; chapter 11: School-age 
and school-going population: Some case studies; chapter 1f: The progress of 
primary education since 1930. 


Includes bibliography of journals. 


O Ensino no Brasil em 1956. Rio de Janeiro, Servico Gráf. do IBGE, 1959. Minis- 
tério da Educacáo e Cultura. Servico de Estatística da Educacáo e Cultura. 2 vol.: 
Vol. I, Ensino Primário Geral; vol. 2, Ensino Extra-primário. (Bras-7200) 


Educación Primaria, 1957. [Bogotá, D.E., 19587] Ministerio de Educación Nacional. 
Oficina de Planeamiento. Sección de Estadística Escolar. 105 p. Boletín de esta- 
dística educacional no. 14. (Col-7200) 


Contiene dos capítulos: 1, Síntesis estadística de la educación en Colombia, 1957; 
H, educación primaria en Colombia, 1957. 


“Disability Daws: Uniteú States, July 1957 — June 1958.” Statistics on volume 
of restricted-activity days, bed-desability days, work-loss days and school-loss days 
by age, sex, residence, family income, major activity, and calendar quarter. Based on 
data collected in household interviews during the period July 1957 — June 1958, 
Health Statistics from the U.S. National Health Survey, series B-M, May 1959, 68 p. 
(USA-7110) 

Includes appendixes: 1, Technical notes on methods; 11, definitions of certain 
terms; TIT, questionnaire. 


“A Guide to the Literature on Statistics of Religious Affiliation with References 
to Related Social Studies.” By Benson Y. Landis. Journal of the American Statis- 
tical Association, vol. 54, no. 286, June 1959, p. 335-357. (USA-3040) 


A bibliographic essav reviewing many sources on statistics of religious affiliation, 
including references to studies by social scientists that treat of or are closely 
related to religious affiliation. A brief summary of the U.S. Censuses of Religious 
Bodies is also made. 


GOVERNMENT AND POLITICAL STATISTICS — 
ESTADÍSTICAS GUBERNAMENTALES Y POLÍTICAS 


“As Contas Nacionais do Brasil, 1947-1958.” Revista Brasileira de Economía, 
2 


ano 13, no. 1, marco de 1959, p. 1-126. (Bras-6000) 


Conteúdo: Introducáo; contas nacionais; índice do produto e renda real; 
quadros básicos nacionais; quadros básicos das unidades federadas. 


Informe de la Oficina del Presupuesto, 1958. [San José, 1959.] Ministerio de 
Economía y Hacienda. 93 p. (CR-8800) 


Presenta el presupuesto nacional en forma analítica, tanto los ingresos como 
los egresos. 

Memoria Anual del Ministerio de Economía y Hacienda, 1958. San José, Dirección 
General de Estadística y Censos, 1959. 147 p. (CR-8800) 

Presenta los informes de los hechos más significativos ocurridos durante el año 
en los diferentes departamentos y secciones del Ministerio los cuales incluyen las 
estadísticas respectivas: Dirección General de Economía, Dirección General de Esta- 
dística y Censos, Tesorería Nacional, Oficina de Presupuestos, Proveeduría Nacional, 
Contabilidad Nacional, Contaduría Mayor de la República, Dirección General de 
la Tributación Directa y Oficina Técnica Mecanizada. 


Informe sobre la Revisión de la Contabilidad del Gobierno Federal. México, D.F., 
Organización Edit. Novarro, 1958. Secretaría de Hacienda y Crédito Público. Co- 
misión de Revisión Contable. 116 p. (Méx-8800) 
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Contiene cinco capítulos: Importancia y funciones de la contabilidad de la 
Hacienda Pública; antecedentes históricos; síntesis y crítica del sistema de conta- 
bilidad en operación; la contaduría de la federación; conclusiones y recomendaciones. 


PR Presupuesto Modelo, Año Fiscal de 1960. Según sometido a la Asamblea 
Legislativa de Puerto Rico por el Gobernador del Estado Libre Asociado de Puerto 
Rico. San Juan, [1959]. Oficina del Gobernador. Negociado del Presupuesto. 
105 p. (aprox.). (USA PR-8800) 

Contenido: Mensaje de presupuesto «del gobernador; forma de presentación del 
presupuesto; resumen general estadístico del presupuesto; presupuesto para gastos 
de funcionamiento; apéndice; relación de puestos 


LABOR AND LIVING CONDITIONS — 
CONDICIONES DE TRABAJO Y DE VIDA 


Labour Force Statistics: Sample Survey Methods. Paris (1954] Organization for 
European Economic Co-operation. 88 p Technical assistance mission no. 105. 
(Int-OEEC-9200) 


Contents: 1, The American current population survey; concept and definitions; 
the questionnaire; sample design; procedure; utilization of the results; current 
population survey costs; II, the Canadian survey; II, the value of the C.P.S. in 
imerica and Canada; the value of C.P.S. for European countries; recommendations, 
Annex: Calculation of sampling errors. 


Revista Internacional de Actuariado y Estadística de la Seguridad Social. 1958- . 
Semestral. Ginebra. Asociación Internacional de la Seguridad Social. (Int-ISSA-9950) 


Publicado también en inglés con el título de International Review on Actuarial 
and Statistical Problems on Social Security. 


“Validity of Data Obtained through Household Inquiries.'* By Erland V. Hofsten. 
Bulletin de Ulnstitut International de Statistique, tome 36, 4e livraison, 1958, 
p. 414-422. (Int-1SI-3020) 


Contents: Kind of data; economic behaviour; purpose of information; what 
is meant by level of living? household and individuals; points in time and periods; 
comparisons to be made; morms vary between individuals; level of satisfaction; 
income and other economic measurements; résumé. 


Salarios en la Ciudad de la Paz, 1958. La Paz, 1959. Ministerio de Hacienda y 
Estadística. Dirección Nacional de Estadística y Censos. Sección Finanzas. 17 p. 
(Bol-9200) 

Incluye la explicación metodológica del método de muestreo utilizado. 


Contiene datos correspondientes al mes de diciembre de 1957 y los meses de 
mayo, junio, septiembre v diciembre de 1958. 


“La Seguridad Social en Bolivia.” Por Pedro Garía F. Revista de la Facultad de 
Economía, año VIII, nos. 10-18, 1955-58, p. 71-98. (Bol-6000) 

Describe los antecedentes jurídicos y los diversos servicios asistenciales, además, 
presenta las estadísticas correspondientes. 


“Padráo de Vida do Operário Industrial de Pórto Alegre.” Por Luís de Freitas 
Bueno. Revista da Faculdade de Ciéncias Económicas, ano V, no. V, dezembro 
1958, p. 7-42. (Bras-6000) 

Conteúdo: Generalidades; características da amostra; receitas familiares; des- 
pesas familiares—despesas anvais; depesas familiares—despesas mensais; estrutura dos 
orcamentos familiares; bibliografia. 

Informes Estadísticos: Hospital Central, Hospital Turrialba, Dispensarios, 1958 
San José, 1959. Caja Costarricense de Seguro Social. Departamento Actuarial y 
Estadístico. 58 p. (aprox.). (CR-9951) 
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Contiene el resumen anual de la información estadística publicada en el 
Boletín de esta oficina sobre los diversos beneficios concedidos a los afiliados en 
las instituciones mencionadas. 

USA “Increase in Rent of Dwelling Units from 1940 to 1950.” By Margaret G. Reid. 

Journal of the American Statistical Association, vol. 54, no. 286, June 1959, 
p. 358-376. (USA-3040) 

Contents: Findings of other investigators; census concepts of rent; price change 
implicit in the rent index?; change in rent paid in large cities; change in rents 
paid in rural nonfarm areas; concluding remarks. 


* k * 


SELECTED LIST OF IASI PUBLICATIONS FOR SALE 
PUBLICACIONES SELECTAS DEL IASI DISPONIBLES 
PARA LA VENTA 


Actividades Estadísticas de las Naciones Americanas. Segunda edición. Washington, D.C 
No. 2, Bolivia. Agosto 1959. 48 p. No. 3, Brasil. Agosto 1957. 90 p. No. 4, Canada. 
Diciembre 1957. 117 p. No. 5, Colombia. Mayo 1956. 68 p. No. 6, Costa Rica. 
Julio 1958. 60 p. No. 8, Chile. Junio 1959. 90 p. No. 10, El Salvador. Marzo 1959. 
48 p. No. 12, Guatemala. Abril 1959. 60 p. No. 14, Honduras. Octubre 1954. 
34 p. No. 16, Nicaragua. Junio 1956. 47 p. No. 17, Panamá. Marzo 1958. 73 p. 
No. 18, Paraguay. Septiembre 1959. 44 p. Precio para cada folleto $0.25. 

Anotaciones sobre el Estado de las Estadísticas Agropecuarias en los Países Americanos. 
Abril 1955. 100 p. Precio $0.75. 

Bibliography of Selected Statistical Sources of the American Nations — Bibliografía de 
Fuentes Estadísticas Escogidas de las Naciones Americanas. May 1947. 689 p. 
Price $5.00. 

Censo Agropecuario: Análisis de los Conceptos y Procedimientos Usados bajo el Pro- 
grama del Censo de las Américas de 1950. Edición revisada. Septiembre 1957. 
73 p. Precio $1.00. 

Censo de Habitación: Análisis de los Conceptos y Procedimientos Usados bajo el Pro- 
grama del Censo de las Américas de 1950. Octubre 1953. 65 p. Precio $0.50. 


Censo de Población: Primeros Resultados de Estudios Adicionales sobre Algunos Tópicos 
Específicos. Julio 1953. 42 p. Precio $0.50. 

Census of Agriculture: Analysis of the Concepts and Procedures Used under the 
Program of the 1950 Census of the Americas. September 1957. 64 p. Price $1.00. 

Census of Housing: Analysis of the Concepts and Procedures Used under the Program 
of the 1950 Census of the Americas. September 1956. 75 p. Price $0.50. 

Census of Population: Preliminary Results of Further Studies on some Specific Topics. 
September 1956. 37 p. Price $0.50. 

Costos de los Censos en Diez Naciones Americanas. Por Germano Jardim. Mayo 1947. 
17 p. Reimpresión de Estadística, Vol. V, No. 16, Septiembre 1947. Precio $1.00. 


Directory of Statistical Personnel in the American Nations — Directorio del Personal 
Estadístico en las Naciones Americanas — Nominata do Pessoal Estatístico das Nagóes 
Americanas — Réportoire du Personnel Statistique des Nations Américaines. With 
biographical information and an appended list of statistical organizations. Fifth 
edition. March 1955. 194 p. Price $2.00. 

Estadística. Journal of the Inter American Statistical Institute (IASI), 1943- . Quarterly. 
Regular issues, approximately 168 p. Annual subscription rate: 1 wear $3.00, 2 
years $5.00, 3 years $7.00. Includes the annual progress report of IASI as supple- 
ment. Special subject issues: No. 36 on statistical teaching and training methods 
and materials; No. 38 on agricultural statistics methods; No. 42 on statistical 
organization and administration; No. 55 on sampling. Issues previous to last four 
$2.00. Subscriptions or single issues may be purchased in national currency from 
agents listed on last page of this Journal. 
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La Estructura Agropecuaria de las Naciones Americanas: Análisis Estadístico-censal de 
los Resultados Obtenidos bajo el Programa del Censo de las Américas de 1950. 
Octubre 1957. 421 p. Precio $2.00. 

La Estructura Demográfica de las Naciones Americanas: Análisis Estadístico-censal de 
los Resultados Obtenidos bajo el Programa del Censo de las Américas de 1950 
(COTA-1950), Volumen Il: Características Económicas de la Población, Tomo 1. 
Población Económicamente Activa y No Económicamente Activa. Características 
Generales de la Población Económicamente Activa. Junio 1959. 236 p. Precio $2.00. 


Tomo 2. Características Combinadas de la Población Económicamente Activa. 
Junio 1959. 282 p. Precio $2.00. 


Geography and Cartography for Census Purposes in Latin America. A survey to obtain 
background material for the program of the 1950 Census of the Americas. Bv 


Jorge Zarur, August 1947. 50 p. Reprint from Estadística. Vol. VI, No. 18-19, 
March-June 1948. Price $0.50. 


Guía para la Clasificación de Países y Lugares en las Estadísticas del Comercio Exterior 
— Guide to the Classification of Countries and Places for Foreign Trade Statistics. 
Percera edición, 1959. 93 p. Precio $0.50. 

Indice Alfabético al Manual de Codificación para la Aplicación de la Clasificación 
Uniforme para el Comercio Internacional. 1957. 124 p. Precio $1.00 


International Statistical Standards: An Annotated Bibliography of the Statistical Recom 


mendations of International Conferences, Meetings, and Agencies. 1955. 144 p. 
Price $1.00. 


Manual de Codificación para la Aplicación de la Clasificación Uniforme para el Comercio 
Internacional (CUCI). Primera edición (preliminar). Octubre 1953. 284 p. 
Precio $5.00. 


Relato del Censo de las Américas de 1950. Una exposición preparada por el Instituto 
Interamericano de Estadística en cooperación con las Direcciones Generales de Esta- 
dística y las Oficinas Nacionales de los Censos de las Naciones Americanas. Sep- 
tiembre 1953. 103 p. Precio $0.50. 

Statistical Vocabulary — Vocabulario Estadístico — Vocabulário Estatístico — Vocabulaire 
Statistique. First edition. June 1950. 177 p. Price $2.00. 


The Story of the 1950 Census of the Americas. Am account prepared by the Inter 
American Statistical Institute in cooperation with the General Bureau of Statistics 


and the National Census Offices of the American Nations. September 1953. 89 p. 
Price $0.50. 


III Inter-American Statistical Conference, Quitandinha, Petrópolis, Brasil, June 9-23, 
1955: Summary and Resolutions — Ill Conferencia Interamericana de Estadística, 
Quitandinha, Petrópolis, Brasil, Junio 9-23, 1955: Resumen y Resoluciones. Sup- 
plement 2 to Estadística, Vol. XIII, No. 48-49, September-December 1955. 140 p. 
Price $1.00. 


Report on the VI Session of the Committee on Improvement of National Statistics, 
Buenos Aires, Argentina, November 17-28, 1958 — Informe sobre la VI Sesión de 
la Comisión de Mejoramiento de las Estadísticas Nacionales, Buenos Aires, Argentina, 
Noviembre 17-28, 1958. Supplement 2 to Estadística, Vol. XVI, No. 61, December 
1958. 238 p. Price $1.00. 


Report on the I Session of the Committee on Statistical Education, of the Inter American 
Statistical Institute, Quitandinha, Petrópolis, Brazil June 3-8, 1955 — Informe 
sobre la I Sesión de la Comisión de Educación Estadística, del Instituto Interame- 
ricano de Estadística, Quitandinha, Petrópolis, Brasil, Junio 3-8, 1955. Suplement 
4 to Estadística, Vol. XII, No. 48-49, September-December 1955. 58 p. Price $1.00. 
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